Anda di halaman 1dari 11

E-book Statistika Gratis...

STATSDATA
Statistical Data Analyst

Distribusi Variabel Acak Diskrit

Pada penulisan Kelima tentang Statistika Elementer ini, penulis akan memberikan bahasan
mengenai Distribusi Variabel Acak Diskrit untuk menambah pemahaman dan contoh soal
mengenai Variabel Acak Diskrit dan fungsi distribusinya. Pada penulisan ini, Distribusi
Variabel Acak Diskrit yang diberikan adalah Distribusi Binomial, Multinomial,
Hipergeometrik, dan Poisson.

Variabel Acak Diskrit.


Variabel Acak adalah suatu fungsi yang memetakan setiap anggota Ruang Sampel S ke
bilangan Real[3]. Dalam statistika, variabel acak disimbolkan dengan huruf-huruf kapital
misalkan X, Y, Z, dll. Variabel acak yang mampu menjalani bilangan bulat adalah Variabel
Acak Diskrit, sedangkan variabel acak yang mampu menjalani bilangan real adalah Variabel
Acak Kontinu. Misalkan X adalah variabel acak diskrit maka fungsi kepadatan probabilitas
(probability density function, PDF) dapat didefinisikan sebagai
pX ( x)  P(X  x)
Dengan kata lain, fungsi pX(x) adalah fungsi distribusi probabilitas dari X untuk variabel acak
diskrit. PDF dari variabel acak diskrit X harus memenuhi sifat-sifat berikut:
1. 0  pX ( x)  1 , PDF bernilai nol sampai satu.

2.  pX ( x)  1 , jumlahan dari semua PDF dari variabel acak diskrit X pada ruang sampel
x

adalah satu.
Misalkan X merupakan variabel acak diskrit maka fungsi kepadatan kumulatif (cumulative
density function, CDF) dapat didefinisikan sebagai.
x
FX ( x)  P(X  x)   p X (k )
k 0

Dengan kata lain, fungsi FX(x) adalah fungsi distribusi dari X untuk variabel acak diskrit. CDF
dari variabel acak diskrit X dapat diilustrasikan sebagai berikut.

www.statsdata.my.id Page 1
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Jika pX(x) merupakan PDF dari variabel acak diskrit X, maka terdapat relasi antara PDF dan
CDF, yaitu
p X ( x)  FX ( x)  FX ( x  1)
P(X  x)  P(X  x)  P(X  x  1) .

Sebagai tambahan, mean dan varian dari variabel acak diskrit masing-masing adalah[1]
   x. pX ( x)
x

dan

 2   ( x   ) 2 . p X ( x) .
x

Contohnya, dalam suatu keluarga yang memiliki dua anak, distribusi probabilitas dari
banyaknya anak yang terlahir perempuan akan mengikuti ketentuan ini
Banyaknya Anak Perempuan X 0 1 2
Probabilitas pX(x) 1/4 1/2 1/4

Nilai mean dan varian dari banyaknya anak yang terlahir perempuan akan dihitung sebagai
berikut:
Misalkan X adalah banyaknya anak yang sukses terlahir perempuan, maka
2
   x. p X ( x)  (0). p X (0)  (1). p X (1)  (2). p X (2)
x 0
  (0).(1 / 4)  (1).(1 / 2)  (2).(1 / 4)  1
dan
2
 2   ( x   ) 2 . p X ( x)  (0  1) 2 . p X (0)  (1  1) 2 . p X (1)  (2  1) 2 . p X (2)
x 0

  (1).(1 / 4)  (0).(1 / 2)  (1).(1 / 4)  0,5 .


2

Jadi, diperoleh mean dan varian dari banyaknya anak yang terlahir perempuan pada suatu
keluarga yangmemiliki dua anak masing-masing adalah 1 dan 0,5 .

www.statsdata.my.id Page 2
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Distribusi Variabel Acak Diskrit.


Pada penulisan ini, diberikan 4 macam distribusi variabel acak diskrit pilihan yang biasa
digunakan, yaitu:
1. Distribusi Binomial
2. Distribusi Multinomial
3. Distribusi Hipergeometrik
4. Distribusi Poisson

Distribusi Binomial.
Sebelum membahas tentang distribusi Binomial, penulis akan menjelaskan materi tentang
Distribusi Bernoulli. Distribusi Bernoulli adalah distribusi probabilitas yang dihasilkan dari 2
outcome/kejadian dalam suatu percobaan, yaitu: sukses (x = 1) dan gagal (x = 0) dengan
probabilitas sukses p dan probabilitas gagal q = 1 – p. Fungsi kepadatan probabilitas (PDF)
dari variabel acak X Bernoulli adalah
X ~ B(1, p)
p X ( x)  P(X  x)  p x q1 x ; x  0,1 ; dengan q  1  p .
Pada percobaan Bernoulli, dilakukan perulangan percobaan acak E sebanyak r kali, yaitu E1,
E2, ..., Er yang mana merupakan suatu urutan dari percobaan Bernoulli jika[3] :
1. perulangan bersifat independen.
2. probabilitas sukses bernilai sama untuk setiap perulangan.
Distribusi Binomial merupakan distribusi probabilitas dari banyaknya outcome/kejadian
sukses pada n percobaan Bernoulli[3]. Fungsi kepadatan probabilitas (PDF) dari variabel acak
X Binomial dirumuskan sebagai
X ~ B(n, p)
n!
p X ( x)  P(X  x)  C xn p x q n x  p x q n x
(n  x)! x!
x  0,1,2,..., n ; q  1  p .

Sebagai contoh, PDF dari variabel acak binomial dengan n = 4 dan p = 0,5 dapat
diilustrasikan sebagai berikut.

www.statsdata.my.id Page 3
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak X Binomial adalah
x x
n!
FX ( x)  P(X  x)   pX (k )   p k q nk ; q  1  p .
k 0 k 0 ( n  k )! k!

Sebagai Contoh, seorang peneliti ingin meneliti obat A untuk penyakit asma. Berdasarkan
survey ditemukan lima puluh dari seratus orang yang sembuh dari penyakit asma setelah
meminum obat ini. Jika 20 orang penderita asma diambil secara acak dan diberi minum obat
A, maka tentukan probabilitas bahwa:
a. tepat 10 orang yang sembuh.
b. maksimal 2 orang yang sembuh.
Misalkan X adalah banyak orang yang sembuh penyakit Asma setelah meminum obat A;
maka p = 50/100 = 0,50 , q = 1 – p = 1 – 0,50 = 0,50 dan n = 20 , sehingga:
a. probabilitas tepat 10 orang yang sembuh adalah
n!
P( X  x )  p X ( x )  p x q n x
(n  x)! x!
20!
P(X  10)  p X (10)  (0,5)10 (0,5) 2010  0,1762 .
(20  10)! 10!

b. probabilitas maksimal 2 orang yang sembuh adalah


x x
P(X  x)  FX ( x)   p X (k )   C nk p k q nk
k 0 k 0
2 2
P(X  2)  FX (2)   p X (k )   C 20 k
k (0,5) (0,5)
20 k

k 0 k 0
200
P(X  2)  C 020 0
(0,5) (0,5)  C120 (0,5)1 (0,5) 201  C 220 (0,5) 2 (0,5) 202
P(X  2)  (1)(1)(0,5) 20  (20)(0,5)(0,5)19  (190)(0,5) 2 (0,5)18  0,0002 .

www.statsdata.my.id Page 4
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Contoh soal ini juga dapat diselesaikan dengan bantuan Tabel Binomial, sehingga:
a. probabilitas tepat 10 orang yang sembuh diperoleh
P(X  x)  P(X  x)  P(X  x  1)
p X ( x)  FX ( x)  FX ( x  1) ; x  10 , n  20 , p  0,5
P(X  10)  P(X  10)  P(X  9)  ... ?

p
n x
.. 0.50 .. 1.00
20 0 |
20 : ↓
20 9 → 0.4119
20 10 → 0.5881
20 :
20 20
P(X  10)  P(X  10)  P(X  9)  0,5881  0,4119  0,1762 .
b. probabilitas maksimal 2 orang yang sembuh diperoleh
P(X  x)  FX ( x) ; x  2 , n  20 , p  0,5
P(X  2)  ... ?

p
n x
.. 0.50 .. 1.00
20 0 |
20 : ↓
20 2 → 0.0002
20 :
20 20
P(X  2)  0,0002 .
Sebagai tambahan, nilai mean dan varian dari variabel acak diskrit X berdistribusi Binomial
masing-masing adalah[2] μ = np dan σ2 = npq.

Distribusi Multinomial.
Distribusi Multinomial merupakan distribusi probabilitas dari banyaknya outcome/kejadian
sukses pada variabel acak diskrit X = {X1, X2, …, Xk} yang berisi kejadian E1, E2, …, Ek dengan
probabilitas sukses p1, p2, …, pk. Fungsi kepadatan probabilitas (PDF) dari variabel acak X
Multinomial adalah

www.statsdata.my.id Page 5
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

X ~ M ult(n, p1 , p 2 ,..., p k ) ; x  {x1 , x 2 ,..., x k }


n!
p X ( x)  P( X  x)  p1x1 . p 2x2 ... p kxk
x1!.x 2 !...xk !
x1  x 2  ...  x k  n ; p1  p 2  ...  p k  1

Sebagai Contoh, seorang manager kedai kopi menemukan bahwa probabilitas pengujung
membeli 0, 1, 2, atau 3 cangkir kopi masing-masing adalah 0,3 , 0,5 , 0,15 , dan 0,05 . Jika
ada 8 pengujung yang masuk kedai, maka tentukan probabilitas bahwa 2 pengujung akan
memesan minuman lain, 4 pengujung akan memesan 1 cangkir kopi, 1 pengujung akan
memesan 2 cangkir, dan 1 pengujung akan memesan 3 cangkir kopi.
Misalkan X adalah banyaknya pengujung yang memesan cangkir kopi dengan x1 = 2, x2 = 4,
x3 = 1, dan x4 = 1; dengan p1 = 0,3 , p2 = 0,5 , p3 = 0,15 , p4 = 0,05 , dan n = 8 , maka
probabilitas bahwa 2 pengujung akan memesan minuman lain, 4 pengujung akan memesan
1 cangkir kopi, 1 pengujung akan memesan 2 cangkir, dan 1 pengujung akan memesan 3
cangkir kopi adalah
n!
p X ( x )  P( X  x)  p1x1 . p 2x2 ... p kxk
x1!.x 2 !...xk !
x  {x1 , x 2 , x3 , x 4 }  {2,4,1,1}
8!
p X ( x )  P( X  x)  (0,3) 2 .(0,5) 4 .(0,15)1 .(0,05)1  0,0354 .
2!.4!.1!.1!
Sebagai tambahan, distribusi Multinomial sama dengan distribusi Binomial, tetapi distribusi
Multinomial memiliki keuntungan lebih untuk menghitung probabilitas ketika ada lebih dari
dua outcome/kejadian untuk setiap percobaan didalam eksperimen. Distribusi Multinomial
merupakan suatu distribusi umum, sedangkan distribusi Binomial adalah suatu kasus khusus
dari distribusi Multinomial[1].

Distribusi Hipergeometrik.
Distribusi Hipergeometrik merupakan distribusi probabilitas dari banyaknya
outcome/kejadian sukses pada populasi sebesar N yang memiliki m elemen dengan kejadian
sukses dan N – m elemen lainnya dengan kejadian gagal yang mana percobaan ini dilakukan
pada n sampel. Fungsi kepadatan probabilitas (PDF) dari variabel acak X Hipergeometrik
dirumuskan

www.statsdata.my.id Page 6
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

X ~ Hyp( N , n, m)
C xm .C nNxm
p X ( x)  P( X  x)  ; x  0,..., min{n, m} .
C nN

Sedangkan, fungsi kepadatan kumulatif (CDF) diskrit dari variabel acak X Hipergeometrik
adalah
x x
Ckm .CnNkm
FX ( x)  P(X  x)   pX (k )   .
k 0 k 0 CnN

Sebagai contoh, suatu panitia pemilihan dibentuk berdasarkan 6 orang yang diambil secara
acak dari 15 orang yang mendaftar. Enam puluh persen diantaranya adalah wanita. Jika X
variabel acak yang menyatakan banyaknya wanita yang terpilih, maka dihitung probabilitas
tepat 2 wanita dalam panitia tersebut.
Misalkan X adalah banyaknya wanita yang terpilih dalam kepanitiaan, maka x = 2, n = 6 ,
N = 15, dan m = 60% dari N yaitu m = (0,60)(15) = 9 , sehingga probabilitas tepat 2 wanita
dalam panitia tersebut adalah
C xm .C nNxm
P( X  x)  p X ( x ) 
C nN
C 29 .C 61529 C 29 .C 46 (36).(15)
P(X  2)  p X (2)     0,1079 .
C 615 C 615 5005

Sebagai tambahan, nilai mean dan varian dari variabel acak diskrit X berdistribusi
Hipergeometrik masing-masing adalah[2]
m
n
N
dan
N n m m
2  n 1   .
N 1 N  N 
Ketika n/N ≤ 0,05 distribusi Hipergeometrik dapat didekati dengan distribusi Binomial
dengan parameter n dan p = m/N. Selanjutnya, nilai mean dan varian dari variabel acak
diskrit X berdistribusi Hipergeometrik masing-masing adalah μ = np dan σ2 = npq .

www.statsdata.my.id Page 7
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Distribusi Poisson.
Distribusi Poisson merupakan distribusi probabilitas dari banyaknya outcome/kejadian
sukses X yang terjadi selama interval waktu atau area tertentu[2]. Interval pengamatan ini
dapat berupa waktu atau ruang 2D/3D, contohnya:
 waktu (berapa banyak pelanggan mengunjungi kantor pos dalam 1 hari),
 ruang 2D (menghitung banyaknya cacat pada cat mobil A),
 ruang 3D (menghitung banyaknya ikan di satu kilometer kubik laut), dll.
Karakteristik percobaan Poisson diberikan sebagai berikut[2] :
1. Banyaknya outcome/kejadian terjadi dalam interval waktu atau area tertentu yang
independen.
2. Probabilitas bahwa suatu outcome/kejadian tunggal akan terjadi selama interval
waktu yang pendek atau area yang kecil secara proporsional dan tidak tergantung
pada banyaknya outcome/kejadian pada interval waktu atau area yang lain.
3. Probabilitas bahwa lebih dari satu outcome/kejadian akan terjadi pada interval waktu
yang pendek atau area yang kecil dapat diabaikan.
Nilai mean banyaknya outcome/kejadian dihitung dari μ = λ t dengan λ adalah derajat
terjadinya outcome/kejadian dan t adalah ketentuan waktu, jarak, area, atau volume yang
menjadi perhatian. Fungsi kepadatan probabilitas (PDF) dari variabel acak X Poisson
dirumuskan
X ~ Poi(  ) ;    t
e   x
p X ( x )  P( X  x )  ; x  0,1,2,...
x!
Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak X Poisson adalah
x
FX ( x)  P(X  x)   p X (k )
k 0

.
x
e  k
FX ( x)  
k 0 k!

Sebagai contoh, mean banyaknya panggilan ke call center dalam dua hari adalah 6
panggilan. Dihitung probabilitas bahwa:
a. Minimal ada dua panggilan dalam dua hari.
b. Ada tujuh panggilan dalam empat hari.
c. Maksimum ada satu panggilan dalam satu hari.

www.statsdata.my.id Page 8
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Misalkan X adalah banyaknya panggilan ke call center dan μ adalah mean banyaknya
panggilan ke call center dalam dua hari (t = 2), maka μ sama dengan 6, sehingga:
a. Jika mean banyaknya panggilan ke call center diberikan dalam dua hari, maka
Probabilitas minimal ada dua panggilan dalam dua hari akan bernilai
Diketahui mean banyaknya panggilan ke call center dalam dua hari
   t  6 , sehingga
P(X  x)  1  P(X  x)  1  P(X  x  1)
x 1
e   k
P(X  x)  1  FX ( x  1)  1  
k 0 k!
P(X  2)  1  P(X  2)  1  P(X  1)
P(X  2)  1  FX (1)
1
e 6 6 k  e 6 6 0 e 6 61 
P(X  2)  1    1      1  0,0174  0,9826 .

k 0 k!  0! 1! 
b. Jika mean banyaknya panggilan ke call center diberikan dalam dua hari, maka
Probabilitas ada tujuh panggilan dalam empat hari akan bernilai
Diketahui mean banyaknya panggilan ke call center dalam dua hari
   t , maka    / t  6 / 2  3
M ean banyaknya panggilan ke call center dalam empat hari
   t  (3)(4)  12 , sehingga
e   x
P(X  x)  f ( x) 
x!
e 12 12 7
P ( X  7)   0,0437 .
7!
c. Jika mean banyaknya panggilan ke call center diberikan dalam dua hari, maka
Probilitas maksimum ada satu panggilan dalam satu hari akan bernilai

www.statsdata.my.id Page 9
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Diketahui mean banyaknya panggilan ke call center dalam dua hari


   t , maka    / t  6 / 2  3
M ean banyaknya panggilan ke call center dalam satu hari
   t  (3)(1)  3 , sehingga
e   k
x
P(X  x)  f ( x)  
k  0 k!
1
e 3 3 k
P(X  1)   k!
k  0

e 3 30 e 3 31
P(X  1)    0,1991 .
0! 1!
Contoh soal ini juga dapat diselesaikan dengan bantuan Tabel Poisson, sehingga:
a. Probabilitas minimal ada dua panggilan dalam dua hari.
Diketahui mean banyaknya panggilan ke call center dalam dua hari
   t  6 , sehingga
P(X  x)  1  P(X  x)  1  P(X  x  1)
P(X  2)  1  P(X  2)  1  P(X  1)
P(X  2)  1  P(X  1)  ... ?

μ
x … 6.00…
0 ↓
1 → 0.0174
:
P(X  2)  1  P(X  1)  1  0,0174  0,9826 .
b. Probabilitas ada tujuh panggilan dalam empat hari.
Diketahui mean banyaknya panggilan ke call center dalam dua hari
   t , maka    / t  6 / 2  3
M ean banyaknya panggilan ke call center dalam empat hari
   t  (3)(4)  12 , sehingga
P(X  x)  P(X  x)  P(X  x  1)
P(X  7)  P(X  7)  P(X  6)  ... ?

μ
x … 12.00

: ↓
6 → 0.0458
7 → 0.0895
:

www.statsdata.my.id Page 10
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

P(X  7)  P(X  7)  P(X  6)  0,0895  0,0458  0,0437 .


c. Probilitas maksimum ada satu panggilan dalam satu hari.
Diketahui mean banyaknya panggilan ke call center dalam dua hari
   t , maka    / t  6 / 2  3
M ean banyaknya panggilan ke call center dalam satu hari
   t  (3)(1)  3 , sehingga
P( X  x)  f ( x)
P(X  1)  ... ?

μ
x … 3.00

0 ↓
1 → 0.1991
:
P(X  1)  0,1991 .
Sebagai tambahan, distribusi Poisson dapat diterapkan pada distribusi Binomial ketika nilai
n sangat besar (n mendekati infinity) dan p sangat kecil (p mendekati 0)[2], dimana
parameter μ = np. Selanjutnya, nilai mean dan varian dari variabel acak diskrit X
berdistribusi Poisson adalah sama, yaitu μ = σ2 = λ t.

REFERENSI
[1] Bluman, A.G., (2012), Elementary Statistics: A Step By Step Approach, Eighth Edition,
New York: McGraw-Hill.
[2] Walpole, R.E., Myers, R.H., Myers, S.L., and Ye, K., (2012), Probability and Statistics for
Engineers and Scientists, Ninth Edition, Boston: Pearson Education.
[3] Lefebvre, M., (2006), Applied Probability and Statistics, New York: Springer.

www.statsdata.my.id Page 11

Anda mungkin juga menyukai