SKRIPSI
SHAFIRA
0706261915
UNIVERSITAS INDONESIA
SKRIPSI
Skripsi ini diajukan sebagai syarat untuk memperoleh gelar Sarjana Sains
SHAFIRA
0706261915
Nama
: Shafira
NPM
: 0706261915
Tanda Tangan
Tanggal
: 13 Juli 2011
ii
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
HALAMAN PENGESAHAN
DEWAN PENGUJI
Pembimbing
Penguji
Ditetapkan di
Tanggal
: Depok
: 14 Juni 2011
iii
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
KATA PENGANTAR
Alhamdulillah, puji dan syukur penulis panjatkan kepada Allah SWT yang
telah memberikan rahmat, taufik dan hidayah-Nya, sehingga penulisan skripsi
dengan judul Penaksiran Parameter Distribusi Binomial Negatif pada Kasus
Overdispersi ini dapat terselesaikan dengan baik. Penulisan skripsi ini dilakukan
dalam rangka memenuhi salah satu syarat untuk mencapai gelar Sarjana Sains
Jurusan Matematika di Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Indonesia.
Penulis menyadari bahwa penyelesaian skripsi ini tidak terlepas dari
bantuan serta dukungan dari berbagai pihak. Oleh karena itu, pada kesempatan ini
penulis ingin mengucapkan terima kasih kepada :
1. Orang tua penulis yang telah mengasuh dan mendidik penulis sampai saat ini
dan selalu memberikan dukungan baik moril maupun materiil, serta tak pernah
berhenti mendoakan penulis.
2. Ibu Dra. Siti Nurrohmah, M.Si dan ibu Dra. Saskya Mary, M.Si selaku dosen
pembimbing. Terima kasih sebesar-besarnya untuk semua bantuan, saran,
kritik dan dorongan semangat serta motivasi yang luar biasa yang diberikan
kepada penulis dalam menyelesaikan skripsi ini.
3. Ibu Dra. Ida Fithriani, M.Si selaku pembimbing akademis. Terima kasih untuk
bantuan, dorongan, saran, bimbingan, dan perhatian untuk penulis selama
menjalani masa kuliah.
4. Bapak Dr. Yudi Satria, M.T. selaku ketua departemen, Ibu Rahmi Rusin, S.Si.,
M.Sc.Tech selaku sekretaris departemen, dan Ibu Dr. Dian Lestari selaku
koordinator pendidikan yang telah membantu penulis selama masa
perkuliahan dan proses penyelesaian skripsi ini.
5. Ibu Rianti, Ibu Netty, Ibu Sarini, Ibu Mila, Ibu Fevi, Ibu Sri, dan seluruh staf
pengajar departemen Matematika UI yang tanpa mengurangi rasa hormat tidak
dapat disebutkan namanya satu per satu. Terima kasih atas segala masukan,
saran, kritikan serta semangat yang diberikan kepada penulis selama proses
iv
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
penyelesaian skripsi ini dan terimakasih atas ilmu yang telah diberikan.
Semoga penulis dapat menggunakan ilmu tersebut dengan sebaik-baiknya.
6. Mas Salman, Mba Rusmi, Mba Santi, Mas Ansori, Mba Fia dan seluruh
karyawan departemen Matematika UI, terima kasih atas segala bantuan dan
kemudahan yang telah diberikan untuk penulis.
7. Kak Isat, Fina, Fairuz, terima kasih atas doa dan dukungannya.
8. Widya, Nedi, Hikmah, Manda, Andi, Danar, Adit (Aca), dan Hanif, terima
kasih sahabat untuk semua saat-saat indah yang kita lalui bersama.
9. Ashari, terima kasih atas bantuannya dalam penyelesaian program matlab
pada tugas akhir ini.
10. Teman-teman seperjuangan di Statistik, Gamgam, Petos, Riyantoto, Winwin,
Shafa, Sica, Anggun, Anjar, Adi, Ciput, Para, Teteh, Wiwi , serta mahasiswa
Matematika UI angkatan 2007 lainnya, Afni, Arip, Ashar, Bow, Citi, Dita,
Fauzan, Ferdi, Lois, Nora, Putuwira, Farah, Iki, Daw, Siska, Tatep, Widi,
Anis, Yos, dan Zul. Terima kasih atas semuanya, masa kuliah ini tak akan bisa
dilupakan.
11. Angkatan 2006, khususnya Kak Teguh, Kak Dian dan Kak Tino, terima kasih
untuk semua nasihat, saran, dukungan semangat, motivasi, dan doa yang
diberikan kepada penulis.
12. Angkatan 2009, khususnya Handa, Cepi, Tika, Faisal, Agung, Soleman,
terima kasih untuk dukungan semangat, motivasi dan doa yang kalian berikan.
13. Semua mahasiswa Matematika UI angkatan 2005 dan 2008.
14. Semua pihak yang telah membantu pengerjaan skripsi ini, yang namanya tidak
bisa disebutkan satu per satu, penulis mengucapkan terima kasih.
Penulis menyadari bahwa masih terdapat banyak kekurangan pada skripsi
ini, penulis mohon maaf. Semoga skripsi ini dapat memberikan manfaat bagi
yang membacanya.
Penulis
2011
v
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
: Shafira
NPM
: 0706261915
Program Studi
: S1
Departemen
: Matematika
Fakultas
: MIPA
Jenis karya
: Skripsi
beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalty
Nonekslusif ini Universitas Indonesia berhak menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data(database), dan mempublikasikan
skripsi saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan
sebagai pemilik Hak Cipta.
Dibuat di : Depok
Pada tanggal : 13 Juli 2011
Yang menyatakan
(Shafira)
vi
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
ABSTRAK
Nama
Program Studi
Judul
: Shafira
: Matematika
: Penaksiran Parameter Distribusi Binomial Negatif pada Kasus
Overdispersi
Data count sering diasumsikan berdistribusi Poisson yang hanya memiliki satu
parameter dengan mean dan variansi sama. Namun pada kenyataannya, sering
ditemukan data count dengan variansi yang lebih besar dari mean, keadaan ini
dikenal dengan overdispersi. Saat terjadi overdispersi, maka data count tidak
berdistribusi Poisson, sehingga perlu dicari distribusi lain yang dapat digunakan
untuk menganalisis data count. Salah satu distribusi yang dapat digunakan adalah
distribusi Binomial Negatif yang merupakan distribusi Campuran PoissonGamma (Mixture Poisson-Gamma Distribution). Pada tugas akhir ini akan
dijelaskan mengenai perumusan distribusi Binomial Negatif sebagai distribusi
Campuran Poisson-Gamma (Mixture Poisson-Gamma Distribution), penaksiran
parameter pada distribusi Binomial Negatif yang merupakan distribusi campuran
Poisson-Gamma, serta mempelajari sifat-sifat taksirannya.
Kata Kunci
vii
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
ABSTRACT
Name
Program Study
Tittle
: Shafira
: Mathematics
: Estimating Parameter of Negative Binomial Distribution
on Overdispersion Case.
Counts data, often assumed follows a Poisson distribution has same mean and
variance value. But in fact, count data often has variance value greater than mean
value, this condition is called by overdispersion. When overdispersion occured,
data count doesnt have a Poisson distribution, so need to find another distribution
which can be applied for data count analyzing. One of distribution which often be
applied is Negative Binomial distribution which is form as a mixture PoissonGamma distribution. In this minithesis, estimators of Negative Binomial
distribution (Mixture Poisson-Gamma distribution) and their characteristics will
be explained.
Keyword
xi + 79 pages
Bibliography
viii
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
DAFTAR ISI
i
ii
iii
iv
vi
vii
ix
xi
xi
1
1
2
2
3
3
5
5
6
6
7
7
8
10
11
12
13
16
17
18
19
19
20
20
21
22
24
24
ix
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
25
29
Universitas Indonesia
32
36
36
42
46
46
47
48
49
49
50
51
x
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
DAFTAR TABEL
Tabel 2.1.
Tabel 4.1
Tabel 4.2
Tabel 4.3
17
47
48
50
DAFTAR GAMBAR
DAFTAR LAMPIRAN
Lampiran 1.
Lampiran 2.
Lampiran 3.
Lampiran 4.
0
2
2
l 2 (a, )
l 2 (a, )
0
dan
0 ..............................................................
2
a 2
Lampiran 6. Algoritma Newton-Rhapson .....................................................
Lampiran 7. Algoritma dari Fungsi Log Likelihood ......................................
Lampiran 8. Algoritma dari Statistik Uji A ...................................................
dan
xi
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
72
77
78
79
Universitas Indonesia
BAB I
PENDAHULUAN
1.1
Latar Belakang
Data count adalah data hasil percobaan acak yang nilai-nilainya berupa
bilangan bulat non negatif {0, 1, 2, }. Misalkan Y adalah suatu peubah acak
yang nilainya berupa data count. Distribusi yang biasa digunakan untuk
memodelkan Y adalah distribusi Poisson. Distribusi Poisson memiliki suatu
karakteristik khusus, yaitu memiliki nilai mean dan variansi yang sama, atau dapat
dinyatakan sebagai berikut :
E(Y ) var(Y ) .
Pada kenyataanya, sering ditemukan data count dengan variansi yang lebih
besar dari mean, keadaan ini dikenal dengan overdispersi. Overdispersi dapat
disebabkan oleh adanya korelasi positif antar observasi atau individu yang diamati
atau terdapat nilai variansi yang besar pada data count (Joseph M Hilbe, 2011).
Terjadinya overdispersi pada data count mengindikasikan bahwa nilai
variansi lebih besar dari mean , hal ini dapat menimbulkan beberapa masalah,
antara lain menyebabkan taksiran parameter yang didapat menjadi tidak efisien
walaupun tetap konsisten, sehingga akan memberikan informasi yang tidak sesuai
(Joseph M Hilbe, 2011).
Saat terjadi overdispersi, asumsi kesamaan mean dan variansi pada
distribusi Poisson dilangar, sehingga perlu dicari distribusi lain yang dapat
digunakan untuk menganalisis data count saat terjadi overdispersi. Salah satu
1
Universitas Indonesia
1.2
Perumusan Masalah
1.3
Tujuan Penulisan
1.4
Pembatasan Masalah
1.5
Sistematika Penulisan
: Pendahuluan
Bab ini berisi latar belakang masalah, perumusan masalah, tujuan
penulisan, pembatasan masalah dan sistematika penulisan.
Bab II
: Landasan Teori
Bab ini membahas tentang teori-teori dasar yang melandasi penulisan
tugas akhir ini yaitu, peubah acak dan jenisnya yaitu peubak acak
diskrit dan kontinu, transformasi peubah acak diskrit, distribusi
Binomial, distribusi Poisson, distribusi Gamma, distribusi campuran
(Mixture distribution), distribusi Binomial Negatif, metode Bayes,
prior natural conjugate, metode taksiran titik salah satunya denga
metode maksimum likelihood, sifat-sifat taksiran titik antara lain tak
Universitas Indonesia
Bab IV
: Aplikasi Data
Bab ini membahas tentang aplikasi data yang meliputi penjelasan
mengenai sumber data, analisis data. Analisis data yang dilakukan
yaitu uji Kolmogorov-Smirnov, penaksiran parameter, dan uji rasio
likelihood.
Bab V
: Penutup
Bab ini berisi kesimpulan dan saran dari tugas akhir ini.
Universitas Indonesia
BAB II
LANDASAN TEORI
2.1
A ), yaitu :
C = {c : c C dan X(c) A }
maka Pr (X A) = P(C), dimana Pr (X A) menyatakan probabilitas dari kejadian
A.
5
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
1. f ( x) 1
A
2. P( A) Pr( X A) f ( x)
A
A. Maka X disebut
peubah acak bertipe diskrit dan f(x) disebut fungsi probabilitas dari X.
f ( x)dx 1
2. P( A) Pr( X A) f ( x)dx
A
A. Maka X
disebut sebagai peubah acak bertipe kontinu dengan f(x) disebut sebagai fungsi
probabilitas dari X.
Universitas Indonesia
2.2
Misalkan X1, X2, , Xn adalah peubah acak diskrit yang memiliki fungsi
probabilitas bersama yaitu f (x1, x2, , xn) dan A adalah himpunan diskrit yang
merupakan ruang nilai dari X1, X2, , Xn sedemikian sehingga f (x1, x2, , xn) > 0
untuk setiap (x1, x2, , xn)
xn) , , yn= un(x1, x2, , xn) mendefinisikan suatu transformasi satu-satu yang
memetakan A ke B, dengan B = {(y1, y2, , yn) : y1= u1(x1, x2, , xn) , y2= u2(x1,
x2, , xn) , , yn= un(x1, x2, , xn), (x1, x2, , xn)
transformasi invers x1 = w1(y1, y2, , yn) , x2 = w2(y1, y2, , yn) , , xn = wn(y1, y2,
, yn) yang memetakan B ke A. Berdasarkan fungsi probabilitas bersama dari X1,
X2, , Xn , didapat fungsi probabilitas bersama dari Y1, Y2, , Yn, yaitu :
2.3
, lainnya
(2.1)
Distribusi Binomial
f ( x) x 1
1 x
, x 0,1
(2.2)
0
, x lain
dimana merupakan probabilitas terjadinya sukses pada percobaan Bernoulli.
Jika dilakukan n percobaan Bernoulli dibawah kondisi yang sama dengan
setiap pengulangan yang saling bebas dan probabilitas sukses dari setiap
percobaan konstan yaitu , dan X adalah peubah acak dimana X didefinisikan
Universitas Indonesia
(2.3)
(2.4)
Dengan persamaan MGF tersebut, dapat ditentukan mean dan variansi dari
distribusi Binomial.
= M(0) = np
2 = M(0) 2
= np(1 p)
2.4
Distribusi Poisson
f ( y; ) Pr(Y y; )
e y
, y 0, 1, 2, ... dan 0
y!
0
, y lain
dimana adalah suatu parameter yang menyatakan rata rata banyaknya
(2.5)
kejadian dalam selang atau interval tertentu. Distribusi Poisson dengan parameter
E Y y f y ,
y 0
y e
y!
y 0
y e
y!
y 1
y 1 e
y. y 1 !
y 1
y 1
y 1e
y 1!
E Y
x e
x o
x !
f x,
x o
1
Sehingga mean dari distribusi Poisson adalah parameternya yaitu . Selanjutnya
akan dihitung nilai variansi dari distribusi Poisson, yaitu :
E Y 2 y 2 f y ,
y 0
y2
y 0
y2
y 1
y2
y 1
y e
y!
y e
y!
y 1 e
y. y 1 !
y 1 1 .
y 1
y 1e
y 1!
y 1e y 1e
y 1 .
1
!
y 1
y 1!
y 2 e
y 1e
y 1 .
y 1 ( y 2)! y 1 y 1!
y 1
Universitas Indonesia
10
y 2 e y 1e
(
y
2)!
y
1
y 1 y 1 !
(
y
2)!
y
1
y 1 y 1 !
f z , f x,
y 1
y 1
.1 1 2
Var Y E Y 2 E Y
2 2
2.5
Distribusi Gamma
1
x 1e x / , 0 x
( )
(2.6)
0
, x lain
dimana definisi dari fungsi Gamma dari atau () pada persamaan (2.6) yaitu
f ( x)
( ) y 1e y dy
(2.7)
untuk > 0 dan nilai dari integral tersebut adalah bilangan positif.
Universitas Indonesia
11
untuk
c
c c 1 ... c 1
c
(2.8)
M (t )
1
(1 t )
,t
,untuk
(2.9)
dengan persamaan MGF tersebut, dapat ditentukan mean dan variansi dari
distribusi Gamma yaitu
= M(0) =
2 = M(0) 2
= 2
Pada aplikasinya, distribusi Gamma sering digunakan sebagai distribusi
untuk memodelkan waktu tunggu (waiting time), pendapatan per tahun, dan
besarnya claim pada perusahaan asuransi.
2.6
12
fX x
f X x u d
(2.10)
E X E E X
(2.11)
Var X E X 2 E X
E Var X E X E E X
E E X 2 E E X
E Var X Var E X
2.7
(2.12)
13
x 1 k
x k
Pr X x
, x k , k 1, k 2, ... dan 0 1
(1 )
k
0
, x lain
(2.13)
0
, y lain
(2.14)
y k k
(1 ) y , y 0, 1, 2, ... dan 0 1
k y!
2.8
(2.15)
, y lain
Kaidah Bayes
Universitas Indonesia
14
(2.16)
(2.17)
Kaidah Bayes :
Jika A1, A2, , AK merupakan kejadian mutually exclusive dan exhaustive
dari ruang sampel S, dengan P( Ai) 0 untuk i = 1, 2,, K maka untuk
sembarang kejadian B, dimana P( B ) 0,
P( Ai B)
P( B Ai ) P( Ai )
P( B A1 ) P( A1 ) P( B A2 ) P( A2 ) ... P( B AK ) P( AK )
(2.18)
Bukti :
P( B Ai ) P( B Ai ) P( Ai )
, i 1, 2, , K
P( Ai B ) P ( Ai B ) P ( B )
, i 1, 2, , K
karena P( B Ai ) P( Ai B) , maka
P( B Ai ) P( Ai ) P( Ai B) P( B)
bagi kedua ruas dengan P( B ), didapat
P( Ai B)
P( B Ai ) P( Ai )
P( B)
dimana
P( B) P B A1 P B A2 ... P B AK
P( B A1 ) P ( A1 ) P ( B A2 ) P ( A2 ) ... P ( B AK ) P ( AK )
Universitas Indonesia
15
P( Ai B)
P( B Ai ) P( Ai )
P( B A1 ) P( A1 ) P( B A2 ) P( A2 ) ... P( B AK ) P( AK )
(terbukti)
(2.19)
(2.20)
Jika merupakan peubah acak kontinu, maka pdf marginal bersama dari X1, X2,
, Xn yaitu:
f ( x1 , x2 ,..., xn )
f ( x1 , x2 ,..., xn , ) d
f x , x ,..., x h( ) d
1
(2.21)
Jika merupakan peubah acak diskrit, maka pdf marginal bersama dari X1,
X2, , Xn yaitu:
f ( x1 , x2 ,..., xn ) f ( x1 , x2 ,..., xn , )
f ( x1 , x2 ,..., xn ) h( )
(2.22)
Universitas Indonesia
16
f ( x1 , x2 ,..., xn )
f ( x1 , x2 ,..., xn , )
f ( x1 , x2 ,..., xn )
f ( x1 , x2 ,..., xn ) h
f ( x1 , x2 ,..., xn )
(2.23)
Persamaan (2.23) merupakan bentuk lain dari aturan Bayes. Dimana fungsi
likelihood
(2.24)
* prior
(Andrew G., John B.C, Hal S.S & Donald B.R, 2000).
2.9
f ( y ) . Pada kasus ini P disebut natural conjugate dari F (Andrew G., John B.C,
Hal S.S & Donald B.R, 2000).
Suatu kelas distribusi probabilitas prior h() dikatakan prior natural
conjugate dari kelas fungsi likelihood f ( y ) jika kelas distribusi probabilitas
prior h() merupakan conjugate dari kelas fungsi likelihood dan fungsi
Universitas Indonesia
17
probabilitas prior h() memiliki bentuk fungsional yang sama dengan fungsi
likelihood f ( y ) .
Berikut adalah tabel beberapa prior natural conjugate dari beberapa fungsi
likelihood.
Binomial
Beta
Multinomial
Dirichlet
Poisson
Gamma
Normal
tidak diketahui, 2 diketahui
Normal
Inverse Chi-Square
Multivariat Normal
tidak diketahui, V diketahui
Multivariat Normal
Inverse Wishart
2.10
Universitas Indonesia
18
Misalkan X1, X2, , Xn adalah sampel acak dari distribusi yang memiliki
distribusi probabilitas f( x ; ) : , dimana adalah parameter yang tidak
diketahui dan adalah ruang parameter. Fungsi likelihood didefinisikan sebagai
pdf bersama dari X1, X2, , Xn yang merupakan fungsi dari , dan biasa
dinotasikan dengan L().
L ; x1 , x2 ,..., xn L
f x1 , x2 ,..., xn ;
f ( x1; ) f ( x2 ; )... f ( xn ; )
n
f ( xi ; )
i 1
Misalkan dapat ditemukan suatu fungsi nontrivial dari x1, x2, , xn,
misalkan disebut u(x1, x2, , xn) sedemikian sehingga ketika diganti dengan
u(x1, x2, , xn) , maka fungsi likelihood L() akan bernilai maksimum. Maka
Universitas Indonesia
19
statistik u(X1, X2, , Xn) disebut penaksir maksimum likelihood dan dinotasikan
dengan u X1 , X 2 ,..., X n . Mencari nilai yang memaksimumkan fungsi
likelihood (L()) akan memberikan nilai yang sama dengan mencari nilai yang
memaksimumkan fungsi ln likelihood (ln L() = l()). Sehingga dalam mencari
taksiran titik dengan metode maksimum likelihood, dapat diperoleh dengan
menyelesaikan persamaan berikut :
l
L
0
0 atau
2.11
Universitas Indonesia
20
lim Pr{ X n X } 1
n
lim Pr{ X n X } 0
n
Sehingga
berlaku
(2.25)
(2.26)
lim Pr 1
n
lim Pr 0
n
(2.27)
nI
Universitas Indonesia
21
ln f x;
I
f x; dx
(2.28)
2 ln f x;
f x; dx
2
(2.29)
atau
2.12
Metode Newton-Rhapson
f pn 1
,n 1
f ' pn 1
(2.30)
Metode ini merupakan salah satu metode yang sering digunakan dan
cukup baik karena dengan metode ini kekonvergenan lebih cepat tercapai.
Teorema Newton-Raphson
Asumsikan f
fungsi yang memiliki turunan kedua yang kontinu pada interval tutup [a, b].
Misalkan terdapat suatu bilangan p
Universitas Indonesia
22
pk 1 g pk pk
f pk
, k 0,1,...
f ' pk
2.13
[p , p + ].
Penggunaan besaran dari rasio dua pdf sebagai dasar dari pengujian
terbaik atau UMPT (Uniformly Most Powerfull Test) dapat dimodifikasi dan
memberikan metode untuk membentuk suatu pengujian dari suatu hipotesis
majemuk terhadap hipotesis alternatif majemuk atau membentuk suatu pengujian
dari suatu hipotesis sederhana terhadap hipotesis alternatif majemuk ketika UMPT
tidak ada. Metode ini membawa kepada suatu pengujian yang disebut uji rasio
likelihood. Uji rasio likelihood tidak perlu merupakan suatu UMPT, namun
pengujian ini seringkali mempunyai sifat-sifat yang diinginkan.
Misalkan X1, X2, , Xn menyatakan n peubah acak yang masing-masing
mempunyai pdf fi(xi ; 1, 2, , m), dengan i = 1, 2, , n. Himpunan yang terdiri
dari semua titik parameter (1, 2, , m) dinotasikan dengan yang biasa disebut
ruang parameter. Misalkan adalah subset dari ruang parameter . Misalkan
ingin melakukan pengujian hipotesis (sederhana atau majemuk) dengan
H0 : (1, 2, , m)
L fi xi ;1 , 2 ,..., m ,
i 1
1 ,2 ,..., m
(2.31)
1, 2 ,..., m
(2.32)
dan
n
L fi xi ;1 , 2 ,..., m ,
i 1
Dimana L() merupakan fungsi likelihood dibawah asumsi H0 benar dan L()
merupakan fungsi likelihood dibawah asumsi H1 benar. Misalkan
dan
adalah fungsi likelihood maksimum yang diasumsikan ada untuk kedua fungsi
Universitas Indonesia
23
terhadap
x1 , x2 ,..., xn
(2.33)
L
0 .
Fungsi mendefinisikan suatu peubah acak (X1, X2, , Xn) dan tingkat
signifikansi dari pengujian diberikan oleh
Pr X1 , X 2 ,... X n 0 ; H 0
(2.34)
Teorema
Misalkan X1, X2, , Xn adalah peubah acak yang memiliki distribusi identik dan
saling bebas dengan pdf f (xi ; ),
dengan
Universitas Indonesia
BAB III
PENAKSIRAN PARAMETER PADA DISTRIBUSI BINOMIAL NEGATIF
UNTUK MENGATASI OVERDISPERSI
3.1
Universitas Indonesia
25
3.2
1 exp
exp 1 ln exp
(3.1)
1
1
. Misalkan
dinotasikan dengan a atau a , maka
1
. Dengan kata lain dapat dikatakan bahwa, berdistribusi
a
Gamma dengan parameter 1/a dan a, dengan fungsi probabilitas sebagai berikut
Universitas Indonesia
26
1
1
1
a
exp
1
1
a
a a
a
(3.2)
exp
1
y!
1
a
aa
a
exp
a
1
1
aa y!
a
1
y 1
a
(3.3)
Pr(Y y ) f y h( )d
0
Pr Y y h( )d
0
exp
a
d
1
1
a
a y!
a
1
y 1
a
1
a y! 0
a
1
a
1
y 1
a
exp
d
a
(a 1) y 1a 1
1
exp
d
1
a
0
y ! a a
a
Universitas Indonesia
27
(a 1)
1
exp
1
a
1
0
a
y ! a
a
a 1
a 1
1
1
y a
Pr(Y y )
misalkan t
(a 1) (a 1)
1
exp
1
a
1
y ! a a 0
a
1
1
1
y ! a a
a
a 1
1
1
y a
1
1
y a
1
1
y a
1
1
y a
a 1
(a 1) (a 1)
a
a
1
1
y a
1
1
y a
exp
(a 1)
dt a 1
a
, maka
sehingga d
dt .
a
d
a
a 1
Pr(Y y )
a
1
1
a 1
1
y ! a a
a
1
1
y ! a a
a
1
1
y a
a 1
a
1
1
a 1
1
y ! a a
a
a
1
1
a 1
1
y ! a a
a
1
1
1
y ! a a
a
exp(t )t
1
1
y a
1
1
y a
1
y a
dt
a 1
1
y a
a
exp(
t
)
t
dt
a 1 0
exp(t )t
1
1
y a
dt
1
y a
y
a
1
a
a a
1
y
a
a 1 a 1
Universitas Indonesia
28
1
1
a
y
y
a a 1
a 1 a 1
1
y!
a
y
1
1 a
y
a a
1
1
1
y!
a
a
a
(3.4)
Persamaan (3.4) diatas memiliki bentuk yang similar dengan bentuk fungsi
probabilitas dari distribusi Binomial Negatif pada persamaan (2.14) dengan
parameter k = 1/a dan
1
, dengan nilai k = 1/a pada persamaan diatas
a 1
29
probabilitas pada persamaan (3.4) memiliki dua parameter yaitu dan a, dimana
3.3
30
distribusi Poisson dan terdapat kesamaan bentuk fungsional antara pdf dari
distribusi Poisson, yaitu
e y
, 0, y 0,1,...
y!
0
, lainnya
f ( y)
exp
, 0
1
a
1
a
a
a
0
, lainnya
Sebelumnya pada subbab 2.9 telah dijelaskan bahwa suatu kelas distribusi
probabilitas prior h() dikatakan prior natural conjugate dengan kelas fungsi
likelihood f ( y ) jika kelas distribusi probabilitas prior h() merupakan
conjugate dari kelas fungsi likelihood , dan fungsi probabilitas prior h() memiliki
bentuk fungsional yang sama dengan fungsi likelihood f ( y ) . Selanjutnya akan
dibuktikan bahwa distribusi Gamma merupakan prior natural conjugate dari
distribusi Poisson.
Misalkan Y adalah peubah acak yang bergantung pada parameter
yang berdistribusi Poisson, dimana distribusi Poisson yang merupakan anggota
dari keluarga eksponensial (bukti terdapat pada lampiran 3), sehingga fungsi
probabilitasnya adalah
e y
f ( y )
, 0, y 0,1,...
y!
Selanjutnya, misalkan distribusi priornya adalah distribusi Gamma dengan
parameter 1/a dan a, sehingga fungsi probabilitas dari adalah persamaan
(3.2), yaitu
1
1
1
a
exp
1
1
a
a a
a
31
y
1
1 a
y
a a
f y
1
1
1
y!
a
a
a
h y
p y p
p y
1
1
e y
1
a
exp
1
y!
1
a
aa
a
1
y
1
a
y
a a
1
1
1
y!
a
a
a
1
1 y a 1
exp 1
1
y
1 a
1
1
a
a
y
1
a 1
a
a
a 1 y 1a 1
exp
1 a
y
a a 1
(3.5)
1
a
a
1
dan
. Distribusi posterior yang dihasilkan ternyata juga berdistribusi
a 1
a
Universitas Indonesia
32
3.4
1
1
1
a y! a a
a 1
y a 1 1
1
1
a 1 a
a 1
a 1
, 0 , a 1 0 , y 0,1, 2,...
1
a
y a 1
pada persamaan diatas dapat dijabarkan menjadi
kombinasi
1 1
1
1
y 1 !
y a 1
a
1 1 1 1 ! y 1 1 1 1 !
a
a
a
a
1
y 1 !
a
1
1 ! y !
a
1
1
1
1 1
y 1 y 2 ... 2 1
a
a
a
a a
y !
y 1 ... 1 1 1 ... y 1
a a a
a a a
y !
y !
1
1 a
y
n
Universitas Indonesia
33
1
yi a 1
yi
1
a
y
1
i
a
(3.6)
y a 1 1 a 1
Pr(Y y) 1
, 0 , a 1 0 , y 0,1,2,...
1
1
a 1 a a
y
a 1
a 1 a 1
1
, 0 , a 1 0 , y 0,1,2,...
1
1
y a a
y
a 1
1
y a
a 1
a 1
, 0 , a 1 0 , y 0,1,2,...
1
a
(3.7)
M (t ) E etY
ety f y
y
M t ety f y
y
a 1 a 1
e
1
1
y 0
y a a
y
a 1
ty
a 1 et a 1
y a 1 a 1
y 0
a 1
1
a
a 1
a 1
a 1 et
y a 1
y 0
Universitas Indonesia
34
a 1
M t
1
a
a 1
t
1 e
1
a
a 1
(3.8)
dimana t ln
, 0, a 1 0 .
1
a
Setelah mengetahui bentuk dari moment generating function (MGF), akan
dicari mean serta variansi dari distribusi Binomial Negatif, dimana
Mean E Y M ' 0
Variansi E Y 2 E Y
M '' 0 E Y
Selanjutnya akan dicari turunan pertama dan turunan kedua dari moment
generating function (MGF), yang akan digunakan dalam menentukan mean serta
variansi dari distribusi Binomial Negatif.
M ' t
dM t
dt
a 1
1
a
a 1
t
e
1
1
a
a 1 1
a 1 t
e
1
a
(3.9)
d 2M t
dt 2
a 1 1
1 a1
a 1 t
t
1
e
a 1
a 1 a 1
M '' t
a
1 a1
1
t 1 t
a
e
e a 1 1
a 1
a 1 a 1
t
e
1
a
(3.10)
Universitas Indonesia
35
Mean M ' 0
a 1
1
a
a 1
1
a
a 1
a 1
1
1
a
a 1
1
a
a 1
a 1 1
a 1
1
a
a 1 a 1
1
1
a
a
(3.11)
Variansi M '' 0 2
a
a 1
1
a
1
a 1 a 1
a 1
a
a 1
1
a 1
a
1
a 1 1
a 1
a 1 a 1
a 1
1
a
a 1
1
1
a
a 1 1
a 1
1
a
1
1 a 1 1
2
1
1
a a
a 1
a 1
a 1 a 1 a 1 a 1
1 1
1
1
a a
a
a
a 1
1
2
1 a 1 1
1
a
a
1 a 1 1 1 2
a
1 1 2
a
2
a 1
Variansi a 2
(3.12)
Dari persamaan (3.11) dan (3.12) didapat bahwa mean dari distribusi
Binomial Negatif adalah , dan variansinya adalah a 2 . Dengan nilai a > 0,
maka dapat disimpulkan bahwa variansi dari distribusi Binomial Negatif lebih
Universitas Indonesia
36
besar dari nilai meannya. Nilai mean dan variansi dari distribusi Binomial Negatif
dapat dinyatakan sebagai
E Y
1
a
a
(3.13)
var Y a 2
1
1
2
a a
a
a
E var
(3.14)
Persamaan (3.13) dan (3.14) diatas sesuai dengan mean dan variansi dari distribusi
campuran (Mixture Distribution) seperti pada persamaan (2.11) dan (2.12).
3.5
Misalkan Y1, Y2, , Yn adalah sampel acak dari distribusi Binomial Negatif
yang memiliki fungsi probabilitas,f (yi ; , a) dimana,
yi a 1 yi a 1
f ( yi ; , a)
, 0, a 1 0 , yi 0,1, 2,...
1
1
1
a yi ! a a
dengan dan a merupakan paremeter yang nilainya tidak diketahui. Sehingga
a 1
Universitas Indonesia
37
nilai kedua parameter tersebut dapat ditaksir. Pada metode maksimum likelihood
akan digunakan persamaan likelihood dalam mencari taksiran dari parameter
dan a. Persamaan likelihood didefinisikan sebagai pdf bersama dari Y1, Y2, , Yn
dan biasa dinotasikan dengan L(a, ). Persamaan likelihood dari distribusi
Binomial Negatif yaitu :
yi a 1 1 a a yi
L a,
1
i 1 yi ! a 1 a
1 a
1
1
1
yi
yi
a 1 a a
1 1 a 1 a
i 1
yi !
a
1 1 a 1 ayi a
1
...
1 a a yi
n
a a
a
yi !
i 1
1 a 1 a
n
1
1
yi
1 a ... 1 ayi a
yi
a a
1
a
L ( a, )
yi !
i 1
1 a 1 a
n
i 1
1 a ... 1 ayi a
a yi . yi !
1 a a
1 a 1 a
yi
yi 1
1
1
ar
yi
n
1 a a
r 1
a yi . yi !
i 1
1 a 1 a
(3.15)
Universitas Indonesia
38
yi 1
1
1
ar
yi
n
1 a a
r 1
L a,
a yi . yi !
i 1
1 a 1 a
yi 1
1
yi
n 1 ar
r 1
1 a a
log L a, log
i 1
a yi . yi !
1 a 1 a
l a,
n
yi 1
1
log 1 ar yi log a log yi ! log1
a
i 1 r 1
1
log 1 a yi log a yi log 1 a
a
n
yi 1
yi log 1 a
a
n
yi 1
yi log 1 a
a
yi 1
i 1 r 1
n yi 1
r 1
(1 a )
i 1
(3.17)
Universitas Indonesia
39
yi
yi 1
l (a, )
r 1
a
0
2 log(1 a )
a
a
(1 a )
i 1 r 1 1 ar
(3.18)
Nilai a dan yang diperoleh dari hasil penyelesaian persamaan (3.17) dan
(3.18) akan memaksimumkan l(a, ) jika
0
2 a 2 a
2.
(3.19)
l 2 (a, )
l 2 (a, )
0
dan
0
2
a 2
(3.20)
yi yi a 1 a
l 2 (a, ) n
2
2 (1 a ) 2
i 1
(3.21)
2
yi 1
2
r
1
3 log(1 a ) 2
a 1 a
r 1 1 ar a
l 2 (a, ) n
2
a 2
i 1
(1
2
a
a
yi
(1 a ) 2
(1 a ) 2
(3.22)
1
1
(1
yi (1 a ) yi a
l (a, )
1
a
a
a
2
a
(1 a ) 2
(1 a ) 2
i 1 a (1 a )
yi a
1
2
i 1 a (1 a )
(1 a )
(3.23)
l 2 (a, )
l 2 (a, )
0
dan
0 , sehingga nilai a dan yang diperoleh sebagai
2
a 2
Universitas Indonesia
40
hasil dari persamaan (3.17) dan (3.18) akan memaksimumkan l(a, ), dan disebut
sebagai taksiran likelihood.
Penaksiran Parameter
Untuk mencari nilai yang memaksimumkan fungsi log likelihood dapat
dilakukan dengan menurunkan persamaan log likelihood terhadap , dengan
parameter a dianggap konstan atau memiliki nilai tertentu. Kemudian
menyamakan persamaan turunan log likelihood terhadap tersebut dengan 0.
Sehingga didapat taksiran untuk yaitu :
n
yi 1
1
l (a, ) n yi yi a a
(1 a )
i 1
n
i 1
yi
yi
yi a 1
0
1 a
yi a 1
1 a 0
i 1
yi
i 1
n
a
n
yi
0
1 a i 1
1 a
y 1 a 1 a 0
i
1
a
n
yi
0
i 1
1 a 1 a
n
1 a a
n
yi
0
i 1
1 a 1 a
n
1
n
yi
0
i 1
i 1
n
Universitas Indonesia
41
i 1
1 a
n
n 0
i 1
y
i 1
y
Y
n
(3.24)
Penaksiran Parameter a
Untuk mencari nilai a yang memaksimumkan fungsi log likelihood dapat
dilakukan dengan menurunkan persamaan log likelihood terhadap a, dengan
parameter dianggap konstan atau memiliki nilai tertentu. Kemudian
menyamakan persamaan turunan log likelihood terhadap a tersebut dengan 0.
Sehingga didapat taksiran untuk a yaitu:
n
yi 1
n
yi 1
i 1 r 1
yi
yi 1
l (a, )
r
1
a
2 log(1 a )
a
a
(1 a )
i 1 r 1 1 ar
n
yi 1 r 2
yi a
a log(1 a )
(1 a )
i 1 r 1 1 ar
0
n
Universitas Indonesia
42
yi 1 r
yi a 1
2
a log(1 a )
0
(1 a )
i 1 r 1 1 ar
n
yi a 1
n yi 1 r n 2
0
a log(1 a )
(1 a )
i 1
i 1 r 1 1 ar i 1
n
n yi 1 r n
log(1
yi a 1 0
(1 a ) i 1
i 1 r 1 1 ar a
n yi 1 r n
n n
yi 0
2 log(1 a )
(1 a ) a i 1
i 1 r 1 1 ar a
(3.25)
Solusi eksak dari persamaan diatas tidak dapat diperoleh, sehingga akan
dilakukan pendekatan numerik dengan menggunakan metode Newton-Rhapson
untuk mencari solusi dari persamaan tersebut.
3.7
L a,
yi 1
1
1
ar
yi
n
1 a a
r 1
a yi . yi !
i 1
1 a 1 a
Universitas Indonesia
43
yi 1
1
1
ar
yi
n
1 1 a a
r 1
yi
yi
a
yi ! 1 a 1 a
i 1
1
yi 1
ar
1
yi 1
yi !
i 1 r 1 1 a 1 a
1 a
r
y
1
n
i a
a
yi 1
1
yi !
i 1 r 1
a
a
L a,
yi 1 b r b b y 1
i
yi !
i 1 r 1
r
n yi 1 1
b 1
i 1 r 1
1 1
b
b
yi 1
y
!
b
lim L a, lim
b
b
i 1 r 1 1 1
b
b
r
yi 1 1 1
n
b
lim
i 1
r 1 1 1
b
b
yi !
yi !
n n
b lim 1 lim yi 1
lim
b
b
b
yi !
i 1 i 1
1
1
b
b
n
n
1
yi
1
lim
yi ! i 1 b 1
i 1
Universitas Indonesia
44
1
yi
e
yi !
i 1
1
L yi
e
yi !
i 1
n
yi
i 1
e n
y !
i
i 1
Definisikan
(3.26)
dimana parameter dapat diambil dari sembarang nilai spesifik dalam gabungan H0
dan H1, sehingga didapat
yi 1
1
1 ar
yi
n
a
1
a
r
a yi . yi !
i 1
1 a 1 a
yi 1
1
1 ar
yi
n
a
1
r 1
yi !
i 1
1 a 1 a
yi 1
n
n
1 ar
y
i
n
a
i1 1
r 1
yi !
i 1
1 a
1 a
dimana
, a 0
(3.27)
yi
i 1
e n
y !
i 1
yi 1
n
1 ar
yi
n
i1 1 a
r 1
1 a
1 a
y
!
i 1
i
n
e
, a 0
yi
1 i1 1
1 a
1 a
n
a
yi 1
r 1
, a 0
1 ar
i 1
Universitas Indonesia
45
e n
1
1 a
, a 0
n
yi
a i 1
yi 1
r 1
1 ar
i 1
n
yi
1 a a
i 1
n
yi 1
1 ar
i 1 r 1
, a 0
(3.28)
A 2 log
L
2 log
n
n
n
yi
a
e 1 a i1
2 log n y 1
1 ar
i 1 r 1
n
n
n
n yi 1
yi
a
2 log e 1 a i1 log 1 ar
i 1 r 1
n yi 1
n n
, a 0
2 n yi log 1 a log 1 ar
a i 1
i 1 r 1
(3.29)
BAB IV
CONTOH APLIKASI
4.1
Sumber Data
Pada contoh aplikasi ini, diberikan 50 data yang merupakan data jumlah
kecelakaan yang terjadi di suatu jalan tertentu, dengan pengemudi yang dipilih
secara acak. Misalkan Y adalah suatu peubah acak yang menjelaskan jumlah
kecelakaan yang terjadi pada suatu jalan tertentu. Untuk melakukan analisis pada
data kecelakaan dalam analisis keselamatan lalu lintas, dibutuhkan suatu distribusi
statistik yang cocok untuk data tersebut. Jumlah kecelakaan di suatu jalan tertentu
diasumsikan berdistribusi Poisson, yang memiliki satu parameter, yang
menyatakan mean dan variansi yang sama. Hal ini mengindikasikan bahwa ratarata tingkat kecelakaan ( ) dalam populasi konstan.
Namun pada kenyataannya, setiap individu memiliki tingkat kecendrungan
kecelakaan yang berbeda. Tingkat kecenderungan yang berbeda antar individu
mengindikasikan bahwa nilai bervariasi antar individu, sehingga apabila
dilakukan analisis statistika dan penaksiran parameter dengan menggunakan
distribusi Poisson pada data saat terjadi overdispersi, akan didapat taksiran
parameter yang tidak efisien dan akan memberikan informasi yang tidak sesuai.
46
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
47
Karena alasan tersebut, distribusi Poisson tidak cocok digunakan pada data saat
terjadi overdispersi. Distribusi Binomial Negatif merupakan salah satu alternatif
yang dapat digunakan dalam melakukan analisis statistik pada data jumlah
kecelakaan saat terjadi overdispersi.
Tabel 4.1 Data Jumlah Kecelakaan
Data Jumlah Kecelakaan di Suatu Ruas Jalan
8
4
0
0
1
3
0
0
8
6
5
4
3
4
3
5
8
3
4.2
6
4
0
3
0
0
1
1
1
4
2
0
2
0
6
10
5
3
8
9
0
2
3
0
4
0
0
0
0
14
0
1
3
4
5
0
6
6
5
5
0
3
10
7
0
0
0
0
5
0
1
1
1
3
2
5
0
3
6
7
6
3
4
4
0
0
8
0
0
9
0
0
8
5
2
5
0
0
6
5
4
5
15
0
5
0
1
0
5
4
0
0
1
1
4
1
6
0
6
2
4
0
0
6
4
0
4
4
0
2
0
0
0
11
1
4
3
0
0
0
0
3
9
3
6
3
0
1
0
0
3
0
0
0
0
0
1
1
2
0
12
6
3
2
4
5
7
0
10
0
0
4
7
3
0
Analisis Data
Dari data diatas selanjutnya akan dilakukan analisis terhadap data tersebut.
Tujuan dari analisis data ini adalah untuk mengetahui apakah terjadi overdispersi
pada data tersebut dan mencari distribusi statistik yang dapat mewakili data
jumlah kecelakaan serta mengetahui penyebaran dan rata-rata dari jumlah
kecelakaan. Terdapat beberapa tahap analisis yang akan dilakukan pada data
tersebut antara lain uji Kolmogorov-Smirnov, penaksiran parameter, dan uji rasio
likelihood.
Universitas Indonesia
48
Hal pertama yang akan dilakukan dalam analisis adalah memeriksa apakah
data tersebut berdistribusi Poisson atau tidak, pengujian yang akan dilakukan
menggunakan uji Kolmogorov Smirnov.
Hipotesis
Untuk melakukan pengujian ini digunakan hipotesis sebagai berikut :
H0 : Data berdistribusi Poisson
H1 : Data tidak berdistribusi Poisson
Tingkat Singnifikansi
Pada pengujian ini akan digunakan tiingkat signifikansi = 0.05
Aturan Keputusan
H0 ditolak jika 0.05
Keputusan
Dengan menggunakan program SPSS, akan didapat output sebagai berikut :
Tabel 4.2 Uji Satu Sampel Kolmogorov-Smirnov
y
N
Poisson Parameter
173
a
Mean
2.92
Absolute
.304
Positive
.304
Negative
-.115
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
4.004
.000
Universitas Indonesia
49
Dari table 4.2 diatas, didapat bahwa nilai 0.000 0.05 , sehingga H0
ditolak.
Kesimpulan
H0 ditolak, hal ini dapat disimpulkan bahwa dengan tingkat kepercayaan 95%,
kita percaya data tersebut tidak berdistribusi Poisson.
50
bahwa taksiran dari parameter , yaitu:
Y
Hasil output deskriptif statistik dengan mengunakan SPSS, sebagai berikut :
Tabel 4.3 Statistik Deskriptif
N
y
Mean
173
2.92
Std. Deviation
3.148
Minimum
Maximum
0
15
Dari tabel 4.3 diatas didapat bahwa taksiran parameter adalah 2.92
51
Hipotesis
Untuk melakukan pengujian ini digunakan hipotesis sebagai berikut :
H0 : a = 0
H1 : a > 0
Tingkat Singnifikansi
Pada pengujian ini akan digunakan tingkat signifikansi = 0.05
Aturan Keputusan
2
H0 akan ditolak jika nilai statistik uji A > 0.05,1
Keputusan
Selanjutnya untuk mengetahui keputusan apakah H0 ditolak atau tidak akan
dihitung nilai dari statistik uji A dengan menggunakan bantuan matlab. Hasil
yang diperoleh adalah sebagai berikut :
Universitas Indonesia
52
Kesimpulan
Dengan tingkat signifikansi 95%, kita percaya bahwa terjadi overdispersi pada
data yang kita gunakan sehingga distribusi Binomial Negatif lebih cocok
digunakan untuk melakukan analisis pada data tersebut dibandingkan dengan
distribusi Poisson.
Universitas Indonesia
BAB V
PENUTUP
Pada bab ini, akan diberikan kesimpulan serta saran dari penulisan tugas
akhir ini.
5.1
Kesimpulan
Data count adalah data hasil percobaan acak yang nilai-nilainya berupa
bilangan bulat non negatif. Distribusi yang biasa digunakan untuk memodelkan
data count adalah distribusi Poisson yang memiliki mean dan variansi yang sama.
Saat terjadi overdispersi, yaitu keadaan dimana variansi dari peubah acak bernilai
lebih besar dari nilai mean dari peubah acak tersebut, asumsi mean dan variansi
sama pada distribusi Poisson tidak lagi terpenuhi. Oleh karena itu diperlukan
distribusi lain untuk menganalisis data count tersebut.
Pada kondisi overdispersi, nilai mean bervariasi antar individu sehingga
mean merupakan suatu peubah acak. Pemilihan distribusi Gamma sebagai
distribusi dari mean akan menghasilkan distribusi Binomial Negatif yang
merupakan distribusi Campuran Poisson-Gamma (Mixture Poisson-Gamma
distribution). Distribusi Binomial Negatif ini merupakan salah satu distribusi
alternatif yang dapat digunakan saat terjadi overdispersi, karena pada distribusi ini
terdapat tambahan parameter yang menjelaskan tentang besar dispersi dari data.
Metode maksimum likelihood dan metode Newton-Rhapson digunakan
untuk melakukan penaksiran terhadap parameter mean dan parameter dispersi.
Taksiran dari parameter mean merupakan penaksir yang tak bias, konsisten, dan
efisien.
53
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
54
5.2
Saran
Universitas Indonesia
DAFTAR PUSTAKA
Universitas Indonesia
56
Universitas Indonesia
, dimana l
Akan dicari distribusi dari statistik uji A 2 l l
adalah nilai maksimum dari fungsi log likelihood sampel di bawah asumsi H0
L maks
2 l l maks
(1)
dimana l maks adalah nilai maksimum fungsi log likelihood dalam gabungan H0
dan H1 benar dengan jumlah parameter r yang dihitung saat maks dan l
adalah nilai maksimum fungsi log likelihood di bawah asumsi H0 benar dengan
jumlah parameter m yang dihitung saat .
dimana
2l
(2)
2
l
0 , karena merupakan taksiran maksimum likelihood , dan
1
2
2l
2
57
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
(3)
Universitas Indonesia
58
(lanjutan)
2l
2
(4)
f x
n /2
A 1
x T A x
exp
(5)
2l
A 1
1
p x N , I
2l
Dimana I adalah informasi terobservasi dengan I
, karena
2
1/2
N 0, I
Universitas Indonesia
59
(lanjutan)
sehingga
I ~ m2
1
l l I
2
T
2 l l I
(6)
2 l l l l l
A 2 l l maks
2 l maks l
maks
maks
maks
(7)
A 2 l l maks ~ r2m
(8)
Universitas Indonesia
E( )
sehingga Y adalah penaksir yang tak bias untuk .
2. Penaksir Konsisten
Untuk melihat apakah taksiran parameter a dan dari metode maksimum
likelihood merupakan taksiran yang konsisten perlu dilihat apakah taksiran
tersebut konvergen dalam probabilitas ke parameter yang ditaksir.
Suatu barisan peubah acak X1, X2, , Xn dikatakan konvergen dalam
probabilitas ke peubah acak X, jika untuk setiap > 0, sedemikian sehingga
lim Pr{ X n X } 1
n
60
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
61
(lanjutan)
mean dan variansi +a 2. Sehinggan mean dan variansi dari Y yaitu dan (+a
2)/n. untuk setiap > 0,
k a 2
Pr Y Pr Y
dimana k
n
. Dengan menggunakan pertidaksamaan Chebyshev,
a 2
didapat :
a 2
Pr Y k
n
Pr Y
a 2
Pr Y
1
k2
a 2
n
a 2
a 2
2n
a 2
lim
n
2n
lim Pr Y
lim Pr Y
n
Karena nilai dari suatu probabilitas tidak mungkin negatif, maka didapat
lim Pr Y 0
n
3. Penaksir Efisien
Untuk melihat apakah taksiran unbiased Y merupakan suatu penaksir
yang efisien untuk , perlu dilihat apakah variansi dari statistik Y mencapai
batas bawah dari Rao-Cramr. Atau dapat dinyatakan sebagai berikut :
Universitas Indonesia
62
(lanjutan)
2 Y
1
nI
ln f y ; , a 2
i
E
atau
2 ln f yi ; , a
f yi ; , a dx
2
2 ln f yi ; , a
E
2
Sehingga dengan
Pr(Yi yi ) f ( yi )
yi a 1 yi a 1
1
1
a 1 yi ! a a
a 1
, 0, a 1 0 , yi 0,1, 2,...
dimana
ln f ( yi ) ln yi a 1 ln a 1 ln yi ! yi ln yi ln a 1
a 1 ln a 1 a 1 ln a 1
akan didapat persamaan Fisher Information dari adalah
y
ln f ( yi ) yi i a
1
a
1
yi
a
1 a
a
Universitas Indonesia
63
(lanjutan)
1
2
2
y
2 i
ln f ( yi )
a
2 1 a
yi
2
2 1 a
2
ln f ( y ) 2
yi 2
i
E
E 2
2
1 a
1
2
I
2
E yi
2
1 a
I
1 a
2
a
2
1
1 a
nI n
2 Y
1
1
1 a
1 a
n
1
nI
1 a 1 a
n
n
Sehingga diperoleh variansi dari Y menyentuh batas bawah persamaan
Rao-Cramr, dan taksiran Y dikatakan penaksir yang efisien untuk .
Universitas Indonesia
f x; exp p K x S x q ,
0
x a1 , a2 , a3 ,...
(1)
, lainnya
f y
y e
y!
, 0 , y 0,1, 2,...
(2)
, lainnya
Fungsi probabilitas pada persamaan (2) diatas dapat dinyatakan dalam bentuk
eksponensial, sehingga persamaannya menjadi
1
f y, exp y ln ln , 0 , y 0,1, 2,...
y!
0
, lainnya
(3)
Persamaan pada persamaan (3) diatas memiliki bentuk yang similar dengan
persamaan (1), dimana
1
S y ln
y!
q
p ln
K y y
64
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
f x 0, x
f x 1
x
Akan dibuktikan bahwa persamaan (3.4) memenuhi kedua syarat diatas, sehingga
dapat dikatakan sebagai fungsi probabilitas. Yang pertama akan dibuktikan bahwa
persamaan (3.4) bernilai non-negatif untuk semua y.
1
y
1
1 a
y
1
a a
f y
, 0, 0 , y 0,1, 2,...
1
1
a
1
y!
a
a
a
(3.4)
1
Dengan
.
Dimana
0 untuk nilai
1
1
0 serta y 0
a
a
1
dan 0 , maka dapat
a
disimpulkan bahwa f y 0, y .
Selanjutnya akan akan dibuktikan bahwa jumlah dari persamaan (3.4)
untuk seluruh nilai y bernilai satu.
1
y 0
y
1
1 a
a a
f y
1 1 1
y 0
y!
a
a
a
65
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
(1)
Universitas Indonesia
66
(lanjutan)
Dalam fungsi Gamma, dapat dibuktikan bahwa :
t 1e t dt
0
lim
1 t
(2)
e dt
t
lim t e e t 1 t 2 dt
M
0
0
1 M
lim M e 1 e t t 2 dt
M
0
lim M
1 M
lim 1 e
M
t 2
dt
0 1 t 2e t dt
0
1 1
y
a
Sehingga bagian
pada persamaan (3.4) dapat dinyatakan dalam bentuk
1
y!
a
1
1
1
1 1 1
y y 1 y 2 ... 1 2 ...
a
a
a
a a a
1
1 1
y!
y ! 1 2 ...
a
a a
1
1
1
y 1 y 2 ...
a
a
a
y!
(3)
67
(lanjutan)
Sehingga persamaan (3) dapat ditulis menjadi,
1
1
1
1
y y 1 y 2 ...
a
a
a
y!
1
y!
a
1
y 1
y 0
f y
a
1
y 0
1
a
1
a
1
a
(4)
y 1 ... 1 1 1 ... y 1
a a a
a a a
y !
y !
1
1 a
y
y
1
y a 1 1 y a
y
maka persamaan (4) dapat ditulis menjadi:
y 0
y
f y 1
a
1
y 0
y
a
1
y 0
y
a
1 a
a
1
a
1 a
a
1
a
Universitas Indonesia
68
(lanjutan)
1
1 a 1
1
y 0 y 1
a
a
(5)
Persamaan a
merupakan suatu deret kuasa.
1
y 0
y a
Selanjutnya akan diperiksa apakah deret tersebut konvergen. Uji rasio mutlak
akan digunakan untuk mencari interval konvergensi dari deret tersebut. Suku ke-n
dan n+1 dari deret tersebut adalah
n
1 1 1
1 ... n 1
a a a
Un
n!
1
a
n 1
1 1 1
1 ... n 1 1
a a a
U n 1
n 1!
1
a
U n 1
n U
n
lim
n 1
1 1 1
1
1
...
a a a
a
1
n 1 n !
a
lim
n
n
1 1 1
1 ... n 1
a a a
1
n!
a
n
a
lim
n
n 1 1
a
Universitas Indonesia
69
n
a
lim
n
n 1 1
a
n
a
lim
n n 1
1
a
1.
1
a
1 x
1 px
p p 1 2
p p 1 p 2 ... p n 1 n
x ...
x ...
2!
n!
p
x n , x 1
n 0 n
(6)
1
y 0
y a
, p = - 1/a, dan n = y
Universitas Indonesia
70
(lanjutan)
1
1
a
1
a
1 1 1
1
a a
1
...
1
a 1
2!
a
a
y
1 1 1
1 ... y 1
a a a
...
1
y!
a
1
y 0
y
a
(7)
1
< 0. Deret tersebut
a
Sehingga deret kuasa pada persamaan (7) akan konvergen ke suatu nilai yaitu :
y
a
1
1
1
y 0
a
a
1
a
1
a
1
a
1
a
(8)
y 0
f y
1
a
1
a
1
a
1
y 0
y
a
Universitas Indonesia
71
(lanjutan)
1
1 a 1
a a
1 1
a
a
1
a
f y 1 , maka terbukti
y 0
Universitas Indonesia
0
2
2
a
a
dan
l 2 (a, )
l 2 (a, )
0
dan
0
2
a 2
adalah :
y y a 1 a
l 2 (a, ) n
i2 i
2
(1 a ) 2
i 1
2
yi 1
2
r
1
3 log(1 a ) 2
a 1 a
r 1 1 ar a
l 2 (a, ) n
2
a 2
i 1
(1
2
a
a
yi
(1 a ) 2
(1 a ) 2
yi
l (a, )
1
a
2
a
i 1 a (1 a )
(1 a )
Nilai yang diperoleh sebagai hasil dari persamaan (3.20) adalah y sementara
nilai a sebagai solusi eksak hasil persamaan (3.21) tidak dapat diperoleh.
Selanjutnya akan dipeiksa apakah
l 2 (a, )
l 2 (a, )
0
dan
0 serta
2
a 2
0 saat y .
2
2
a
a
72
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
73
(lanjutan)
Memeriksa
l 2 (a, )
0
2
y y a 1 a
l 2 (a, ) n
i2 i
2
(1 a ) 2
i 1
n
i 1
1
y2
yi yi a 1 a
y 2 (1 ay ) 2
n
yi
i 1
n
a
n
yi a
2
(1 ay ) i 1 i 1
ny
a
n any
2
y
(1 ay ) 2
n
na
1 ay
y (1 ay ) 2
n
na
y (1 ay )
1
a
n
y (1 ay )
ay 1 ay
n
y (1 ay )
1
n
0
y (1 ay )
Memeriksa
l 2 (a, )
0
a 2
2
yi 1
2
r
3 log(1 a ) 12
a 1 a
r 1 1 ar a
l 2 (a, ) n
2
a 2
i 1
(1
2
a
a
yi
(1 a ) 2
(1 a ) 2
Universitas Indonesia
74
(lanjutan)
2
yi 1
2
r
1 y
3 log(1 ay ) 2
a 1 ay
r 1 1 ar a
n
y
y2
i 1
(1
ay
)
2
a
a
yi y
(1 ay ) 2
(1 ay ) 2
2
yi 1
2
r
1 y
log(1 ay ) 2
a 1 ay
r 1 1 ar a 3
n
y
1
2
i 1
2 (1 ay ) y yi
(1 ay )
2
yi 1
2
r
1 y
log(1
ay
)
a 2 1 ay
r 1 1 ar a 3
n
2
i 1
y yi
1 y
(1 ay ) 2
a 1 ay
2
yi 1
2
r
1 y
3 log(1 ay ) 2 2
a 1 ay
r 1 1 ar a
n
2
1
i 1
y yi
a
(1 ay ) 2
2
n yi 1
n
n 2
r
2y
log(1 ay ) 2
a
1
ay
i 1 r 1 1 ar i 1 a 3
i 1
2
n y yi
i 1 (1 ay ) 2
n
2
2
y
y
i
n yi 1
a
r 2n
2ny
i 1
log(1 ay ) 2
i 1 r 1 1 ar a 3
a 1 ay
(1 ay ) 2
Universitas Indonesia
75
(lanjutan)
y 2 ny
n yi 1 r 2 2n
2ny
a
3 log(1 ay ) 2
2
a 1 ay
(1 ay )
i 1 r 1 1 ar a
2
n yi 1
n 2 y ay 2 2 ln 1 ay
r
a
i 1 r 1 1 ar a 2 1 ay
2
n yi 1
n 2ay a 2 y 2 2 1 ay ln 1 ay
r
a 1 ay
i 1 r 1 1 ar a 2
2
n yi 1
r
n
ay ay 1 ay 2 1 ay ln 1 ay
i 1 r 1 1 ar a 3 1 ay
2
n yi 1
r
n
ay ay 1 ay 2 1 ay ln 1 ay 0
3
i 1 r 1 1 ar a 1 ay
0
2
2
l (a, )
terlebih dahulu, yaitu :
a
yi a
l (a, ) n
1
2
a
i 1 a (1 a )
(1 a )
n
yi a
1
2
i 1 a (1 ay )
(1 ay )
n
n yi
1
a
2
i 1 a (1 ay )
i 1 (1 ay )
Universitas Indonesia
76
(lanjutan)
n
n
1
1
n
2 i
a (1 ay ) (1 ay ) i 1
i 1 a
ny
n
a
a (1 ay ) (1 ay ) 2
a
n(1 ay ) n ay
a
2
a (1 ay )
0
l 2 (a, )
l 2 (a, )
0
Karena nilai
dan
0 , maka persamaan
2
a 2
l 2 (a, ) l 2 (a, )
diketahui bahwa
l (a, )
0 , sehingga akan didapat bahwa
a
0.
2
2
Universitas Indonesia
| %10s
|\n','n','pn');
fprintf('--------------------------\n');
fprintf('|
| %16.10f |\n',p0);
for(i=1:N)
p=p0-subs(F,p0)/subs(l,p0);
fprintf('|%3.d
| %16.10f |\n',i,p);
if(abs(p-p0)<TOL)
fprintf('--------------------------\n\n');
fprintf('Nilai aproksimasi akar dari l(a)\n');
fprintf('yang berada dalam [0,inf) adalah a = %.10f\n',p);
break;
end
p0=p;
end
77
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
function [F]=fungsi(miu)
load data.mat Y
syms a;
N=length(Y);
m=0;
for i=1:N
for r=1:(Y(i)-1)
m=m+r/(1+a*r);
end
end
F=m+(N/a^2)*log(1+a*miu)-miu/(1+a*miu)*(N/a+sum(Y));
78
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia
function [A]=fungsiA(miu)
load datay.mat datay
N=length(datay);
m=0;
miu=input('masukkan nilai miu : ');
a=input('masukkan nilai taksiran a : ');
for i=1:N
for r=1:(datay(i)-1)
m=m+log(1+a*r);
end
end
fprintf('Nilai dari statistik uji A adalah \n');
A=-2*((-N*miu)+((N/a)+sum(datay))*log(1+a*miu)-m)
79
Penaksiran parameter ..., Shafira, FMIPA UI, 2011
Universitas Indonesia