Toaz - Info Terjemahan Bab 7 13 Lee J Bain PDF PR
Toaz - Info Terjemahan Bab 7 13 Lee J Bain PDF PR
DISTRIBUSI LIMIT
7.1 PENDAHULUAN
Di bab 6 telah dibahas metode umum untuk mendapatkan fungsi sebuah distribusi dari
variabel acak yaitu ( ). Pada beberapa kejadian, pdf dari dapat dicari
dengan mudah. Namun terdapat kejadian yang tidak mudah untuk diselesaikan. Beberapa di
antaranya, untuk mendapatkan hasil pendekatan dengan n bernilai besar. Hasil tersebut
didasarkan pada dugaan konvergensi dari distribusi limit.
DEFINISI 7.2.1
Jika Yn~Gn(y), untuk setiap n=1,2,… dan jika untuk beberapa CDF G(y) yaitu,
( ) ( ) (7.2.2)
untuk semua nilai y dimana G(y) kontinu, pada barisan Y1,Y2….. dikatakan konvergen dalam
distribusi Y~G(y), dan dinyatakan dengan Yn d Y ,CDF G(Y) disebut : Distribusi
terbatas dari Yn.
Contoh 7.2.1
Diberikan X1,X2,…Xn sampel acak dari sebuah distribusi uniform Xi~UNIF(0,1) , dan
Yn:Xn:n merupakan order statistik terbesar, dengan CDF= ( ) , untuk
Dapatkan distribusi limit dari Yn=Xn:n.
Penyelesaian:
PDF distribusi Uniform :
Xi~UNIF(0,1) ( )
CDF distribusi Uniform : ( ) ∫ ( ) ∫
Yn= Xn:n adalah order statistik terbesar,dan untuk mencari CDF dari Yn yaitu sebagai berikut:
( ) [ ]
[ ( )]
( ) (7.2.3)
Sehingga didapatkan,
Gn(y)={
1
( ) ( )
Jadi,
G(y) = { (7.2.4)
merupakan distribusi limit untuk Yn
Gambar 7.1 : Grafik dari CDF Gn(y) dengan limit degenerate CDF G(y)
DEFINISI 7.2.2
Fungsi G(y) adalah CDF dari suatu distribusi degenerate pada nilai y=c, diperoleh
G(y) = { (7.2.5)
Dengan kata lain, G(y) adalah CDF dari sebuah distribusi diskrit yang mempunyai peluang
sama dengan 1 di nilai y=c dan 0 untuk yang lain.
Contoh 7.2.2
Diberikan X1,X2,…Xn adalah sebuah sampel acak dari distribusi eksponensial, Xi~EXP(),
dan Yn=X1:n adalah order statistik terkecil. Tentukan distribusi limit untuk Yn .
Penyelesaian :
PDF distribusi Eksponensial:
X~EXP() ( )
CDF distribusi Eksponensial:
( ) ∫
2
limit tidak hanya diskontinu di y=0 tetapi juga tidak kontinu di bagian kanan y=0, yang mana
telah menjadi syarat sebuah CDF.
DEFINISI 7.2.3
Sebuah barisan peubah acak Y1,Y2,…dikatakan konvergen stokastik ke konstanta c jika
mempunyai distribusi limit yang degenerate pada y=c.
Tambahan: Berikut adalah persamaan limit yang sering di gunakan dalam menyelesaikan
soal distribusi limit yaitu
( ) (limit natural) (7.2.7)
( )
( ) jika ( ) (7.2.8)
Contoh 7.2.3
Diberikan X1,X2,…Xn adalah sebuah sampel acak dari distribusi pareto, Xi~PAR(1,1), dan
Yn=nX1:n order statistik terkecil . Dapatkan distribusi limit dari Yn.
Penyelesaian :
( )
( )
PDF distribusi Pareto: Xi~PAR(1,1) yaitu ( ) {
∫ ( ) ∫ ( )
( )
∫ ∫ ( )
( )
∫ ( )
Misalkan :
( )
( ) ∫
[ ( ) ]
( )
( )
Sedangkan, CDF dari Yn adalah:
( ) [ ]
[ ( )]
3
[ ( ) ]
( ) [ ] (7.2.9)
Dengan menggunakan limit natural pada persamaan 7.2.4, kita peroleh distribusi limit
sebagai berikut:
( ) ( )
( )
( )
dan 0 untuk yang lain, yang merupakan CDF dari distribusi eksponensial, EXP(1). Ini jika
diilustrasikan di dalam gambar 7.2, yang mana menunjukkan grafik dari G(y) dan Gn(Y)
untuk n=1,2, dan 5
Gambar 7.2 : Grafik dari CDF Gn(y) dengan distribusi limit G(y)
Contoh 7.2.4
Untuk sampel acak dari contoh sebelumnya 7.2.3, tetapi dengan Yn=Xn:n yang mana
merupakan order statistik terbesar. Dapatkan distribusi limit dari Yn.
Penyelesaian:
CDF dari contoh 7.2.3 yaitu :
( )
[ ]
( ) [ ] (7.2.10)
4
Dan 0 untuk y yang lain. Karena , kita dapatkan distribusi limit yaitu:
( ) ( ) untuk semua y, dimana bukan CDF karena tidak mendekati 1
dengan .
Contoh 7.2.5
Pada contoh sebelumnya yaitu contoh 7.2.3 dengan ( ) adalah order statistik
terbesar. Dapatkan distribusi limit dari Yn.
Penyelesaian :
CDF dari contoh 7.2.3 yaitu :
( )
[ ]
[ ]
[ ]
( ) [ ] (7.2.11)
Distribusi limitnya yaitu : ( ) ( )
[ ]
[ ]
( )
Contoh 7.2.6
Dari sebuah sampel acak pada contoh 7.2.2 dengan ( ) adalah order
statistik terbesar. Dapatkan distribusi limit dari Yn.
Penyelesaian :
CDF dari contoh 7.2.2 yaitu :
( )
5
( )
[ ]
( )
[ ]
( ) [ ] (7.2.12)
[ ]
( ) ( )
Sekarang menghitung ketelitian saat melimitkan CDF dengan pendekatan Gn(y) untuk n yang
besar. Misalkan waktu bertahan dalam bulan untuk beberapa tipe dari komponen variabel
acak X~EXP(1) dan misalkan 10 komponen yang independen tersebut terhubung dengan
sistem parallel. Waktu kegagalan dari sistem adalah T=X10:10, dan CDFnya
( ) ( )
Untuk pendekatan ini digunakan distribusi limit CDF:
( ) [ ]
[ ]
( )
( )
( )
( )
Misalkan t yang digunakan pada saat t=1,2,5 dan 7 bulan , maka pendekatan peluangnya
diperoleh sebagai berikut:
t: 1 2 5 7
( ) 0.010 0.234 0.935 0.9909
( ) 0.025 0.258 0.935 0.9909
Jadi , nilai pendekatan meningkat ketika n bertambah.
Contoh 7.2.7
Diberikan sebuah sampel mean dari sampel acak yang berdistribusi normal ( ), dan
̅ ( ⁄ )
( )
√
CDF dari distribusi normal :
( ) ( )
6
CDF dari Yn adalah : ( ) [ ]
[ ]
⁄ ⁄
√ √
√ ( ) √ ( )
[ ]
√ ( )
( ) [ ] (7.2.13)
Limit dari CDF Yn degenerate pada karena, ( ) ( ) jika ⁄
jika dan 1 jika , jadi sampel mean konvergen stokastik ke .
TEOREMA 7.3.1
Misal adalah barisan variabel acak dengan CDF masing-masing ( ) ( ) dan
dengan MGF masing-masing ( ) ( ) Jika ( ) adalah MGF dari CDF ( )
( ) ( ) untuk semua pada selang terbuka , maka
( ) ( ) untuk semua titik kontinu pada ( ).
Contoh 7.3.1
Diberikan X1, ..., Xn adalah sampel acak dari distribusi Bernoulli, ( ) dan
∑ . Jika untuk dengan untuk . Dapatkan distribusi
limit dari Yn.
Penyelesaian :
PDF distribusi Bernoulli :
( ) ( )
MGF distribusi Bernoulli :
( ) ( ) ∑ ( )
7
Contoh 7.3.2
Hukum Bernoulli untuk Nilai yang Besar
Misalkan terdapat tetap dan mengingat barisan dari proporsi sampel, ̂ ⁄ .
Dengan menggunakan deret ekspansi ⁄ dengan ⁄ . Dapatkan
distribusi limit dari Wn .
Penyelesaian:
PDF distribusi Bernoulli :
( ) ( )
MGF distribusi Bernoulli :
( ) ( ) ∑ ( )
⁄
( ) ( )
[ ( ) ]
( )
[ ] (7.3.3)
Dimana ( )⁄ meliputi bentuk yang diabaikan dari deret ekspansi, dan ( ) untuk
. Dari limit (7.2.8) didapat
( ) (7.3.4)
dimana MGF dari distribusi berada pada dan ̂ konvergen stokastik pada untuk
mendekati tak hingga.
Contoh 7.3.3
Mengingat barisan variabel yang ‘terstandarisasi’:
(7.3.5)
√
Dengan notasi yang disederhanakan √ , didapat ⁄ ⁄ . Dapatkan
distribusi Limitnya.
Penyelesaian:
Dengan menggunakan deret ekspansi dari contoh sebelumnya,
⁄ ⁄
( ) ( )
⁄ ⁄
[ ( )]
[( )( )]
( )
[ ] (7.3.6)
Dimana ( ) untuk . Jadi,
⁄
( ) (7.3.7)
yaitu MGF dari distribusi normal standar, dan maka ( ). Ini merupakan contoh
dari hasil limit khusus yang disebut Teorema Limit Pusat.
8
TEOREMA 7.3.2
Teorema Limit Pusat
Jika adalah sampel acak dari distribusi dengan mean µ dan variansi , lalu
limit distribusi dari
∑
(7.3.8)
√
Contoh 7.3.4
Diberikan adalah sampel acak dari distribusi uniform, ( ) dan
∑ . Dapatkan Yn dengan pendekatan distribusi normal.
Penyelesaian:
Pdf distribusi Uniform:
Xi~UNIF(0,1) ( )
CDF distribusi Uniform :
( ) ∫ ( ) ∫
( )
Variansi dari distribusi Uniform:
( ) ( )
( )
9
Contoh 3.2.9:
Misalkan 1% dari produksi transistor sebuah perusahaan adalah cacat. Sebuah model baru
komputer membutuhkan 100 transistor dan 100 transistor tersebut diseleksi acak dari
perakitan perusahaan. Diperoleh 3 transistor cacat dalam pengacakan tersebut, maka
peluangnya diperoleh transistor cacat
( ) ( )
( ) ( )( ) ( )
( )
( )
Contoh 7.3.3 , dengan p dan barisan baku yang sesuai digunakan untuk distribusi normal
standart, maka menggunakan sebuah pendekatan normal. Dalam kenyataannya, hal tersebut
digunakan untuk nilai n yang besar dan memiliki nilai p maka didekati dengan Yn
~N(np,npq). Pendekatan ini bekerja paling baik ketika nilai p=0,5 karena distribusi binomial
simetri ketika p=0,5. Ketepatan ini tergantung pada aplikasinya. Pedoman digunakan untuk
distribusi normal standart ketika dan , tetapi tetap memerlukan ketelitian.
Contoh 7.4.1 :
Peluang seorang pemain basket melakukan sebuah penembakan adalah p = 0,5. Jika pemain
melakukan 20 penembakan, berapa peluang pemain melakukan penembakan paling sedikit 9
kali?
Penyelesaian :
Yn~BIN(n,p)
n = 20
p = 0,5
q = 0,5
np = nq = 10 ≥ 5 sehingga dipendekatan Yn ~N(np,npq)
Penyelesaian :
P [Y20≥9] = 1 - P[Y20≤8]
=1 – ∑ ( )
Sebuah pendekatan normal
P [Y20≥9] = 1 - P[Y20≤8]
= 1- ( )
√
= 1 - Ø ( - 0,89 )
= 0,8133
10
Karena distribusi binomial merupakan distribusi distribusi diskrit dan distribusi normal
merupakan distribusi kontinu, pendekatannya dapat diperbaiki dengan membuat sebuah
koreksi kontinuitas. Kenyataannya, masing-masing distribusi binomial , ( ),
mempunyai hasil yang sama dengan luas sebuah persegi panjang dengan tinggi ( ) dan
selang [ ] sebagai dasarnya, karena panjang dasarnya 1. Daerah persegi
panjang tersebut dapat dipendekatan dengan daerah dibawah PDF dari ( ), yang
berhubungan dengan distribusi normal dengan mean dan varians ( ). Hal tersebut
ditunjukkan untuk n=20, p=0.5 dan y=7 dalam gambar 7.3, dimana probabilitasnya adalah
( ) ( )( ) ( )
Aprosikmasi ditunjukkan dengan daerah yang diarsir pada gambar,
Gambar 7.3 koreksi kontinuitas untuk pendekatan normal dari sebuah probabilitas binomial
( ) ( ) ( ) ( )
√ √
yang lebih mendekati nilai yang sebenarnya tanpa koreksi kontinuitas. Keadaan ini
ditunjukkan dalam gambar 7.4.
Umumnya, jika ( ) adalah bilangan bulat , maka
11
[ ] Φ( ) ( ) (7.4.1)
√ √
Koreksi kontinuitas juga berguna untuk distribusi diskrit yang dapat dipendekatan
dengan distribusi normal.
Contoh 7.4.2
Misalkan ( ) dimana n adalah bilangan bulat positif. Dari hasil pada bab 6,
diketahui bahwa mempunyai distribusi yang sama dengan jumlahan ∑ , dimana
X1,….,Xn independen, Xi~POI(1) . Berdasarkan teorema limit pusat , ( )√
( ) yang menunjukkan pendekatan Yn~N(n,n) untuk n yang besar. Sebgai
contoh, n=20, Berapakah nilai [ ]
Penyelesaian :
Diketahui :
Ditanya : [ ]
Jawab : PDF poisson f(x;μ) = x ,
[ ] ∑ = 0,982
Dan nilai pendekatannya
Φ( ) ( )= Φ( ) ( )
√ √
12
7.5 DISTRIBUSI NORMAL ASIMPTOTIK
Akibat dari teorema limit pusat , jika sampel meannya distandarisasi berdasarkan pada
̅
persamaan 7.3.13 yaitu yang berhubungan dengan barisan Zn Z~N(0.1).
√
Hal tersebut tidak sesuai untuk distribusi dengan sampel mean ̅ sebagai pendekatan
dari N(μ, σ2/n) untuk n yang besar.berikut ini contoh dari dugaan yang lebih umum.
DEFINISI 7.5.1
Jika adalah barisan variabel acak, serta dan konstan, maka
( ) (7.5.1)
⁄√
untuk , dan dikatakan mempunyai distribusi normal asimptotik dengan mean
asimptotik dan variansi asimptotik ⁄
Contoh 7.5.1
Berdasarkan sampel acak dalam contoh 4.6.3 yang menunjukkan n=40 daya tahan sebuah
peralatan elektrik, Xi~EXP(100). Dengan teorema limit pusat , ̅
Mempunyai distribusi normal asimptotik dengan mean =100 dan varians c2/n=(100)2/40=250.
Teorema 7.5.1
Misalkan adalah sampel acak dari sebuah distribusi kontinu dengan pdf ( ) yang
kontinu dan tidak nol pada persentil ke- , , untuk . Jika ⁄ (dengan
tertentu), maka barisan order statistik ke- , , adalah normal asimptotik dengan
mean dan variansi ⁄ , dimana
( )
(7.5.2)
[ ( )]
Contoh 7.5.2
Misalkan adalah sampel acak dari distribusi eksponensial, ( ), sehingga
( ) dan ( ) . Untuk n ganjil, ( )⁄ , sehingga
adalah median dari sampel. Jika , maka mediannya
( ) maka
= 0.5
( )
13
( )
Dan [ ( )] ( )
Dengan demikian, normal asimptotik dengan mean asimptotik dan variansi
asimptotik ⁄ ⁄
Contoh 7.5.3
Misalkan X1,…., Xn adalah sebuah sampel acak dari distribusi uniform, Xi ~ UNIF (0,1),
sehingga PDF nya :
( )
CDF nya :
( ) ∫ ( )
∫ ( ) ∫ ( )
∫ ( )
∫
| = x-0 = x ; 0<x<1
Diasumsikan bahwa n adalah bilangan ganjil dan k=(n+1)/2, sehingga Yk=Xk:n adalah
order statistik pusat atau median sampel. Persamaan 6.5.3 yaitu
( ) [ ( )] [ ( )] ( )]
( ) ( )
menjelaskan pdf dari Yk yang memiliki bentuk khusus karena k-1=n-k=(n-1)/2 dalam contoh
ini. Maka, PDF nya adalah
( ) ( )
[ ( )] (7.5.3)
{[ ]}
( )
Dan hal ini menunjukkan nilai konstan pada (7.5.4) yang mendekati 1/√ dengan n .
14
7.6 SIFAT-SIFAT KONVERGENSI STATISTIK
Untuk mengetahui apakah suatu estimator merupakan sebuah estimator yang baik adalah
dengan sifat antara lain konvergen stokastik ke nilai parameternya untuk
TEOREMA 7.6.1
Barisan Y1,Y2,… konvergen stokastik ke c, jika dan hanya jika untuk setiap =0,
[| | ] (7.6.1)
Sebuah barisan dari variabel acak yang memenuhi teorema (7.6.1) disebut konvergen dalam
Contoh 7.6.1:
Contoh 7.3.2 terbukti, sehingga disebut hukum Bernoulli Law of Large Numbers
(LLN) dengan pendekatan MGF. Itu juga dapat diuji dengan teorema sebelumnya dan
dengan pertidaksamaan Chebychev. Secara khusus, mean dan varians dari pn adalah
E (pn) = p dan Var (pn) = pq/n , jadi
P[ | pn – p | < ] ≥ 1 – pq/ 2n
[| | ] ≥ 1– pq/ 2n
≥ 1-0
≥1
Maka , untuk setiap > 0, maka [| | ]
Pendekatan yang sama juga bisa digunakan untuk membuktikan hasil yang lebih umum,
biasanya disebut sebagai Law of Large Numbers (LLN).
Teorema 7.6.2
Jika X1, X2, . . . , Xn adalah contoh acak dari distribusi dengan mean (µ) berhingga dan
varians (σ2), maka barisan dari sampel mean konvergen dengan peluang ke µ :
Bukti : Dari E( ̅ ) = µ
Var ( ̅ )= , dengan demikian
[| ̅ | ] (7.6.3)
Sehingga,
[| ̅ | ]
Jadi,
[| ̅ | ]
15
Teorema 7.6.3
√ ( ) Z~N(0,1), maka
Contoh 7.6.2 :
Diketahui bahwa dalam contoh 7.5.2 dan 7.5.3 bahwa median sampel Xk:n adalah normal
asimptotik dengan mean asimptotik x0.5 .Sehingga dalam teorema diperoleh bahwa Xk:n
x0.5 dengan n dan k/n 0.5.
Maka sesuai teorema 7.5.1 jika k/n p, maka order statistik konvergen stokastik terkecil
pada persentil ke p adalah Xk:n xp
TEOREMA 7.7.1
Untuk barisan variabel acak, jika maka . Untuk kejadian khusus ,
melimitkan distribusi berarti menurunkan distribusi [ ] . Kondisi ini digunakan
untuk mendefinisikan konvergensi stokastik.
TEOREMA 7.7.2
Jika , maka untuk setiap fungsi ( ) yang kontinu di ,
( ) ( )
BUKTI
Karena ( ) kontinu di , hal tersebut berarti untuk setiap dan ada, dimana
| | berakibat | ( ) ( )| . Hal ini berakibat [| ( ) ( )| ]
[| | ] karena ( ) ( ) sebagaimana . Tetapi karena , hal itu
berarti untuk setiap berlaku [| ( ) ( )| ] [| |
] . Limit pada ruas kanan tidak mungkin melebihi 1, maka harus sama dengan 1, dan
( ) ( ).
16
TEOREMA 7.7.3
Jika dan adalah dua barisan variabel acak yang mana dan ,
1.
2.
3. ⁄ untuk
4. ⁄ ⁄ jk [ ] utk semua .
5. √ √ jk [ ] utk semua .
CONTOH 7.7.1
Misal ( ).
Diketahui ̂ ⁄ .
Maka ̂ ( ̂) ( )
CONTOH 7.7.2
Dari sampel acak berukuran dari distribusi Bernoulli, ( ), diketahui
̂
( )
√ ( )⁄
⁄
Juga diketahui jika ̂ ( ̂) ( ) maka jika dibagi dengan [ ̂ ( ̂ )⁄ ( )]
menjadi
̂
( ) (7.7.2)
√ ̂( ̂)
TEOREMA 7.7.5
Jika , maka untuk setiap fungsi kontin ( )u berlaku ( ) ( ), dengan asumsi
( ) tidak bergantung pada .
17
TEOREMA 7.7.6
Jika √ ( )⁄ ( ) dan jika ( ) mempunyai turunan bukan nol pada
√ [ ( ) ( )]
( ) maka ( )
| ( )|
BUKTI
Didefinisikan ( ) [ ( ) ( )]⁄( ) ( ) jika , dan misal ( ) .
Hal tersebut berarti ( ) kontinu di dengan ( ) , dan dengan demikian
( ) ( ) ( ).
√ [ ( ) ( )] √ ( ) [ ( ) ( )]
Selanjutnya, | ( )|
[ ] ( )
.
Dari teorema 7.7.3 didapat [ ( ) ( )]⁄ ( ) , dan hasilnya didapat dari teorema
7.7.4.
Berdasarkan pemahaman awal dari distribusi normal asimptotik, dapat disimpulkan untuk
bernilai besar, jika ( ⁄ ) maka
[ ( )]
( ) { ( ) }
Contoh 7.7.3
Teorema Limit Pusat menyebutkan bahwa mean dari sampel terdistribusi normal asimptotik,
√ (̅ )
( )
Atau perkiraan untuk yang bernilai besar,
̅ ( )
Diketahui dari teorema 7.7.6 bahwa fungsi yang dapat diturunkan dari ̅ juga terdistribusi
normal asimptotik. Sebagai contoh, jika ( ̅ ) ̅ , maka ( ) , dan diperkirakan
( )
̅ [ ]
18
TEOREMA 7.8.1
Jika limit dari barisan CDF adalah CDF kontinu, ( ) ( ) , kemudian untuk an > 0
dan bn yaitu ( ) ( ) (7.8.1)
Jika dan hanya jika dan .
TEOREMA 7.8.2
Jika limit dari barisan CDF adalah CDF kontinu, dan jika
( ) ( ) untuk semua n > 0 dan semua Real y,
Kemudian ( ) ( ) untuk αn > 0, jika dan hanya jika dan
( )
dengan n ∞.
dan ( ) [[ ( ) ]] ( ) (7.8.7)
19
Teorema 7.8.3
( )
Jika memiliki distribusi limit G(y) , kemudian G(y) harus memenuhi 3 tipe
nilai distribusi tertinggi:
1. Tipe I (untuk maksimum) (tipe eksponensial)
( )
( ) ( ) , -∞<y<∞ (7.8.8)
2. Tipe II (untuk maksimum) (tipe chauchy)
( )
( ) ( ) , y > 0, γ > 0 (7.8.9)
3. Tipe III (untuk maksimum) (tipe limit)
( )
( ) [ ( ) ] , y < 0, γ > 0 (7.8.10)
1 ,y≥0
TEOREMA 7.8.4
( )
Dalam menentukan pembatasan distribusi dari ,
( ) [ ( )] ( ) (7.8.11)
Jika dan hanya jika [ ( )] ( ) (7.8.12)
Diberikan CDF F(x) yang mungkin dapat menggunakan teorema 7.8.4 untuk menyelesaikan
an dan bn pada F(x) untuk setiap 3 tipe pembatasan distribusi. Sehingga, jika tipe limit untuk
F(x) diketahui, kemudian an dan bn dapat di hitung. Jika tipe tidak diketahui, maka an dan bn
tetap dapat dihitung untuk setiap jenis dan kemudian diterapkan untuk melihat tipe hasilnya.
Satu sifat dari CDF yang digunakan dalam mengekspresikan konstanta standar yaitu
“Karakteristik Nilai Terbesar”
DEFINISI 7.8.1
Karakteristik nilai terbesar, Un, dari CDF F(x) di definisikan oleh persamaan
[ ( )] (7.8.13)
Untuk sampel acak dengan ukuran n dari F(x), jumlah yang diharapkan dari pengamatan yang
akan melebihi Un adalah 1. Peluang bahwa sebuah pengamatan akan melebihi Un adalah
[ ] ( )
dan jumlah yang diharapkan untuk pengamatan n independen adalah
[ ( )]
Teorema 7.8.5
( )
Diberikan X~F(x), dan asumsikan bahwa memiliki pembatasan distribusi.
1. Jika F(x) adalah kontinu dan naik tegas, kemudian distribusi limit dari Yn adalah tipe
Eksponensial jika dan hanya jika
[ ( )] , -∞<y<∞ (7.8.14)
20
Dimana bn = Un dan an adalah solusi dari
( ) ( )
2. G(y) adalah tipe Cauchy jika dan hanya jika
( )
, k > 0, γ > 0 (7.8.15)
( )
( ) [ ]
[ ]
= [ ]
= [ ]
=1- ( )
Pembatasan distribusi dari Wn disebut H(w) kemudian diberikan dengan
( ) ( ) ( ) ( )
Dimana G(y) sekarang menunjukkan pembatasan distribusi dari ( ) .
Sehingga untuk menemukan H(w), distribusi terbatas untuk minimum. Langkah pertamanya
menentukan ( ) ( ) dan pembatasan distribusi
G(y) dengan metode penggambaran untuk maksimum, sebagai terapan dari ( ).
Kemudian pembatasan distribusi dari Wn adalah ( ) ( )
Catatan : jika ( ) harusnyauntuk limit tipe 1, mungkin ( ) memiliki tipe yang
berbeda. Sebagai contoh maksimum dari EXP() mempunyai pembatasan distribusi tipe 1,
sedangkan ( ) memiliki tipe tiga, maka pembatasan distribusi dapat diubah menjadi tipe
tiga.
DEFINISI 7.8.2
Nilai karakteristik yang paling kecil adalah Sn yang didefinisikan dengan
( ) (7.8.24)
21
TEOREMA 7.8.6
Jika ( ) mempunyai pembatasan distribusi H(w), kemudian H(w) harus
mengikuti salah satu dari tiga nilai distribusi tertinggi.
1. Tipe I ( untuk minimum) (tipe eksponensial)
Dalam keadaan ini didefinisikan oleh
( )
Dan ,
( ) ( )
( ) ( ) ( ),
Jika dan hanya jika ( )
2. Tipe II (untuk minimum) (tipe Cauchy)
Dakam keadaan ini dan
( ) ( )
( ) ( ) [ ( ) , >0
Dan
( ) ( )
( ) ( ) ( ), >0
Jika dan hanya jika
( )
( ) ( )
( )
RANGKUMAN
Tujuan dari bab ini adalah untuk membahas dugaan dalam kekonvergenan sebuah
distribusi, distribusi limit, dan kekonvergenan dalam probabilitas. Konsep ini sangat penting
untuk dipelajari melalui sifat-sifat asimptotik dari barisan variabel acak dan distribusnya.
The Law of large Number (LLN) dan Teorema Limit Pusat (CLT) berhubungan dengan
sifat limit dari fungsi tertentu sebuah rataan sampel yang berarti ukuran sampel mendekati tak
hingga. Khususnya, LLN menyatakan bahwa barisan dari rataan sampel bersifat konvergen
stokastik pada rataan populasi suatu kondisi tertentu. Tipe kekonvergenan ini ekuivalen
dengan kekonvergenan pada peluang kasus ini, karena limitnya bernilai konstan. Sedangkan,
CLT menyatakan bahwa mengubah yang sesuai dengan bentuk barisan dari rataan sampel
adalah distribusi limit normal. Teorema ini memiliki dampak teoritis yang penting pada
22
peluang dan statistik, dan juga memberikan pendekatan pada banyak situasi . Contohnya,
CLT memberikan pendekatan yang bagus untuk distribusi binomial.
SOAL-SOAL LATIHAN
1. Diberikan sebuah sampel acak dengan ukuran n dari sebuah distribusi dengan CDF
( ) {
[ ( )]
( )
Jadi didapatkan,
( )
( ) {
( )
( )
( )
Jadi didapatkan distribusi limit dari ( ) yaitu ( ) dan degenerate ke y=1
23
c. Dengan maka √
Sehingga CDF dari yaitu :
( ) [ ]
[ ( )]
[ ( )]
√
( )
√
( )
( ) {
2. Diberikan sebuah sampel acak berukuran n dari sebuah distribusi dengan CDF
( ) ( ) , untuk semua x bilangan real.
a. Dengan order statistik terbesar Xn:n, apakah mempunyai distribusi limit?
b. Dengan , apakah mempunyai distribusi limit? Jika iya, tunjukkan!
Penyelesaian :
a. PDF : ( ) ( )
Dengan order statistik terbesar Yn=Xn:n , dan CDF ( ) ( )
Sehingga CDF untuk Yn=Xn:n yaitu :
( ) [ ]
[ ( )]
[( ) ]
( )
24
( ) ( )
( )
[( ) ]
[ ]
[ ]
[ ]
[ ]
( ( ))
Distribusi limitnya yaitu :
( ) ( )
( ( ))
( ( ))
3. Diberikan sampel acak dengan ukuran n dari sebuah distribusi dengan CDF
( ) {
25
Sehingga CDF untuk yaitu :
( ) [ ]
[ ( )]
[ ( )]
[ ]
c. Dengan
[ ( ) ]
[ ]
[ ]
26
( )
[ ]
( )
[ ]
( )
Jadi didapatkan ,
( ) {
( )
= 1- [ ]
=1-0,8413 = 0,1587
̅ √ ( ) √ ( )
(b) P[ ]= [ ] [ ]
√ ( ) √ ( )
= [ ] [ ]
= [ ( )] [ ( )]
= [ ] [ ]
=0.9772-0.8413 = 0.1359
27
( ) {
Tentukan:
(a) Jika , maka tentukan pendekatan
[∑ ]
(b) Jika merupakan nilai terkecil dari n, maka tunjukkan bahwa dimana
( ) ∫ ( )
( )
(a)
( )
[∑ ] [∑ ]
[∑ ]
28
(b) [ ( )]
[ ( ) ]
( )
( )
Jadi,
(c) ( ( ))
[| | [| |
[ |( ( )) |
( ( ))
[| |
Jadi,
(d) ( )
( ) [ ]
[( ) ]
[ ]
( )
[ ( ) ]
[( ) ]
[ ]
(e) ( ) ( ) ( )
( ) ( )
( )
( )
29
[ ( )]
( )
[ ( )]
( )
( )
( )
( )
(f)
Dari (e) diketahui bahwa asimptotik normal dengan mean . Sehingga
dapat disimpulkan bahwa
(g)
( ) [ ]
[ ]
[ ]
[ ]
[ [ ]]
[ [ ( )]]
[ ( ) ]
30
[ ( )]
( )
Penyelesaian:
(a) ( ) {
[ ]
̅
̅
Jadi terbukti bahwa stokastik konvergen ke [ ]
(b) ( )
√ Karena ( )
maka
( )
( )
(c) ̅ ( ̅ )
[ ]
̅ ( ̅ )
̅ ̅
31
( )
√
( )
√
( ( ) )
√
( ( ) )
√
( )
( ) [ ]
[ ]
[ ]
[ ( )]
[ ( )]
( )
Jadi,
( ) {
( ) ( )
( ) ( )
32
( ) [ ]
[( ) ( ) ] Sehingga didapat ;
[ ]
[ ] ( ) {
[ ]
[ ]
[ ]
[ ]
33
BAB VIII
STATISTIK DAN DISTRIBUSI SAMPLING
8.1 PENGANTAR
Pada Bab 4 telah diterangkan tentang sampel acak. fungsi distribusi empiris digunakan
untuk memberikan alasan mean sampel dan varians sampel sebagai perkiraan intuitif mean
dan varians dari populasi distributi. Tujuan dari bab ini adalah untuk memperkenalkan
konsep statistik, yang meliputi sampel mean dan varians sampel sebagai kasus khusus, dan
untuk mendapatkan sifat statistik tertentu yang memainkan peran penting dalam bab-bab
selanjutnya
8.2 STATISTIK
Terdapat himpunan teramati dari variabel acak, Sebagai contoh, terdapat
variabel yang merupakan sampel acak berukuran dari suatu populasi.
DEFENISI 8.2.1
Jika terdapat fungsi dari variabel acak, , dimana tidak dipengaruhi oleh
parameter yang tidak diketahui, maka disebut statistik
Dalam notasi ini, lambang adalah fungsi yang kita gunakan dalam untuk
menentukan statistik, yang dilambangkan oleh kapital T. diperlukan bahwa variabel dapat
diamati karena penggunaan yang dimaksudkan dari statistik. Tujuannya adalah untuk
membuat kesimpulan tentang distrubuti dari himpunan variabel acak, dan jika variabel tidak
teramati atau jika fungsi , tergantung pada parameter yang tidak diketahui, maka
T tidak mempengaruhi dalam membuat kesimpulan seperti itu. Sebagai contoh, mengenai
data lihat contoh pada bab 4.6.3 tentang mencari order dataterkecil sampai terbesar yang
diperoleh dengan mengamati tahan dari 40 bagian listrik yang dipilih secara acak. adalah
wajar untuk menganggap bahwa adalah nilai-nilai observased sampel acak dengan ukuran 40
dari populasi semua bagian seperti biasanya, populasi tersebut akan memiliki satu atau lebih
parameter yang tidak diketahui, seperti populasi yang tidak diketahui un berarti, katakanlah
. Untuk membuat inferensi tentang populasi, misalkan perlu numerik mengevaluasi
beberapa fungsi dari data yang juga tergantung pada parameter yang tidak diketahui kita,
34
Ketika sampel acak merupakan nilai dari , maka perhitungan dari data biasanya di
tulis dengan yang berguna untuk memperkirakan mean populasi, .
Teorema 8.2.1
Dan
Contoh 8.2.2
Terdapat variabel acak , dan terdapat sampel acak dengan ukuran n dari
distribusi Binomial, . Mean dan varians dari populasi adalah dan
Sehingga didapat,
Contoh 8.2.3
Maka didapat:
35
Teorema 8.2.2
Pembuktian:
Pembuktian :
Yang merupakan MGF dari variabel normal dengan mean dan varians
36
Akibatnya : jika Xi,...,Xn merupakan sampel acak dari maka
8.3.2 DISTRIBUSI CHI-SQUARE
Distribusi Gamma dengan θ=2 dan κ= disebut distribusi Chi-Square. Atau bisa
dituliskan sebagai berikut
Teorema 8.3.2
Jika , maka
Teorema 8.3.3
Jika , maka
Pembuktian:
Ini merupakan distribusi Chi-Square dengan derajat kebebassan 2κ.CDF Gamma juga dapat
dinyatakan dalam bentuk notasi Chi-Square. Jika dan jika [CDF Chi-
Square dengan derajat bebas v], maka :
Teorema 8.3.4
Jika
Pembuktian:
37
Yang merupakan MGF dari
Teorema 8.3.5
Jika
Pembuktian:
Teorema 8.3.6
3.
Pembuktian :
1) Dengan menambah dan mengurangkan x dengan hubungan :
38
Perhatikan transformasi bersama :
Maka :
dan
.
Terbukti bahwa dan suku-suku adalah independen
Karena , Maka berdasarkan bukti diatas
terbukti independen.
2) Perhatikan bahwa
Dan
Jadi
Contoh 8.3.6:
1. Berapa waktu yang dibutuhkan suatu komponen dengan distribusi Gamma dengan θ =
3 dan κ =2. Dimana komponen tersebut dapat bertahan 90%. Sedemikian hingga
.
Penyelesaian :
Dengan demikian :
39
Maka :
untuk θ = 3 dan κ =2
; n=20 ; µ = 101 ;
40
Teorema 8.3.3
Pembuktian :
Hasil dari Z dan V bisa dibuktikan dengan cara :
Jika , dengan ,
Pembuktian :
Pada saat 2r yaitu :
41
Seperti yang dijelaskan di awal, satu aplikasi dari distribusi t akan muncul ketika
terdapat sampling dari distribusi normal, seperti yang diilustrasikan pada teorema ini.
Teorema 8.3.5
Pembuktian :
DISTRIBUSI SNEDECOR’S F
Teorema 8.3.6
42
Teorema 8.3.7
Jika , maka
Pembuktian :
Terdapat dan adalah independen, dan chi-square (8.3.6). sehingga dapat diperoleh:
Persentil dari adalah
yang diberikan pada Tabel 7 (Appendix C) untuk nilai dan . Persentil untuk nilai
kecil dari dapat diperoleh dengan menggunakan ), kemudian
).
Jadi diperoleh ,
sehingga didapatkan ,
Contoh 8.3.7:
dan adalah sampel acak yang independen dari populasi dengan
distribusi masing-masing adalah dan
43
dan
DISTRIBUSI BETA
Sebuah variabel F dapat ditransformasikan ke distribusi beta. Jika ,
memiliki variable acak seperti berikut
mempunyai pdf
dimana dan .
Pdf ini menjelaskan tentang distribusi beta dengan parameter dan
dinotasikan .
Persentil ke- dari distribusi beta dapat ditulis dengan bentuk persentil dari distribusi ,
yaitu :
Jika dan adalah bilangan bulat positif, maka diintegralkan secara berurutan
dengan bagian utama untuk hubungan antara CDF dari distribusi beta dan distribusi binomial.
Jika dan , maka
Distribusi beta muncul dalam hubungan dengan distribusi dari statistik order. Untuk
variable acak kontinu , pdf dari statistic order ke-k dalam sampel acak dengan
ukuran n diberikan sebagai berikut.
44
Dibuat perubahan dari variabel maka didapat .
Karena dan merupakan order terbesar ke-k dari variabel acak
uniform. CDF dari dapat ditulis dengan bentuk CDF beta, karena
Contoh 8.3.8
Diketahui dan menghitung kemungkinan yang berhubungan dengan .
Dimana
dan
dan
atau
dimana adalah median dari sample dan adalah mean dari populasi.
Kita dapat mengetahui tentang definisi distribusi beta dan dapat mengetahui
hubungannya dengan distribusi dan CDF binomial, seperti aplikasi untuk distribusi dari
variabel acak uniform berorder. Distribusi beta menjelaskan tentang distribusi uniform secara
45
umum dan melengkapinya dengan model dua-parameter fleksibel untuk berbagai tipe dari
variabel yang terletak antara 0 dan 1.
Jika , maka
Dimana,
Pembuktian :
Maka,
Atau pendekatannya,
46
Dikatahui juga bahwa dan dengan pertidaksamaan Chebychev’s
SOAL-SOAL LATIHAN
( )
; n=20 ; µ = 101 ;
⁄
√
⁄
√
[ ] [ ]
2. Berapa waktu yang dibutuhkan suatu komponen dengan distribusi Gamma dengan θ = 3
dan κ =2. Dimana komponen tersebut dapat bertahan 90%. Sedemikian hingga [
] .
Penyelesaian :
[ ] ( ⁄ κ)
Dengan demikian :
( κ)
Maka :
47
( κ)
untuk θ = 3 dan κ =2
( ) ( )( )
[ ( )] [ ]
48
5. Bandingkan pendekatan The Wilson-Hilferty (persamaan 8.5.2) dengan nilai pada tabel
untuk ( ) ( )
Penyelesaian :
Pendekatan The Wilson-Hilfery
[ √ ]
[ √ ]
( )
( ) ( )
7. Seorang analisis keuangan mengambil suatu sampel sebesar 10% 300 laporan keuangan
dan mendapatkan bahwa rata-rata keuntungan Rp. 148,50 dengan standart deviasi Rp.
35,75. Jika rata-rata keuntungan populasi Rp. 138,00 , berapakah probabilitas bahwa
keuntungan yang diperoleh dan diambil secara random Rp. 148,50 atau lebih dan
tentukan jumlahnya?
Penyelesaian :
√ √
√ √
49
Dengan demikian,
(̅ ) ( )=
Jumlahnya
( ( ))
( ( ))
( )( )
8. Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dibutuhkan oleh sebuah
mesin untuk memproduksi suatu kertas. Diambil secara random 36 rim kertas, waktu
rata-rata yang dibutuhkan untuk memproduksi 1 rim adalah 1,5 menit. Jika diasumsikan
standart deviasi populasi 0,30 menit, Tentukan estimasi interval rata-rata dengan tingkat
konfidensi 95 persen
Penyelesaian :
√ √
Dengan tingkat konfidensi 95 %, nilai . Dengan dimasi demikian estimasi interval
rata-rata :
̅ ( )
̅
9. Seorang investor pada saat ini memegang saham kelompok aneka industri yang terdiri
dari industri mesin dan alat berat, otomotif, tekstil, dan garmen. Pengamatan selama 2
bulan terakhir menunjukkan bahwa 44% probabilitas harga saham kelompok ini
meningkat. Investor lain ternyata memegang saham kelompok perdagangan dengan
probabilitas harga saham meningkat sebesar 67%. Apabila investor memiliki 100 lot
untuk saham aneka industri dan 200 lot untuk saham perdagangan, berapa probabilitas
beda presentasi harga saham kelompok perdagangan meningkat 10% lebih besar
dibandingkan dengan kenaikan harga saham kelompok aneka industri ?
Penyelesaian :
Perdagangan :
Aneka industri :
Beda proporsi atau selisih proporsi
Standar deviasi dari selisih proporsi adalah :
50
( ) ( )
=√
( ) ( )
=√
( )
10. Sebuah bank Danamon di pasar bursa terus mengalami fluktuasi. Harga saham pernah
turun mencapai 1200 dan naik mencapai 1600. Selama pengamatan 60 hari harga saham
bank Danamon rata-rata mencapai 1400 dengan standar deviasi 98. Berapa peluang bank
Danamon turun di bawah 1350 dan berapa peluang harganya meningkat di atas 1500 ?
Penyelesaian :
√ √
51
BAB IX
ESTIMASI TITIK
9.1. Pendahuluan
Pada bab ini akan diasumsikan bahwa distribusi dari suatu populasi dapat
direpresentasikan oleh anggota dari suatu pdf keluarga, ( ) berparameter θ. Pada
beberapa kasus, parameternya akan menjadi nilai vektor dan akan digunakan θ untuk
mendapatkannya.
Dimisalkan Ω sebagai parameter populasi dan θ adalah himpunan semua nilai yang
mungkin. Jika θ adalah vektor maka Ω akan menjadi himpunan bagian dari ruang Euclidean
pada dimensi yang sama dan dimensi Ω akan berkaitan dengan nilai parameter lain yang
tidak diketahui. Diasumsikan bahwa (X1, X2, …, Xn) adalah sampel acak dari ( ) dan
τ(θ) adalah suatu fungsi dari θ.
Definisi 9.1.1
Suatu statistik T =ƭ(X1, X2, …, Xn) digunakan untuk mengestimasi nilai τ(θ) disebut estimator
τ(θ) dan nilai amatan statistik t = ƭ (x1, x2, …, xn) disebut estimasi τ(θ).
Jelas bahwa ini termasuk kasus untuk mengestimasi nilai parameternya sendiri, misalkan
τ(θ)=θ. Pada definisi 9.1.1, digunakan tiga simbol yang berbeda, huruf (T) menotasikan
statistik yang digunakan sebagai estimator, huruf (t) merupakan nilai amatan atau
estimasinya, huruf(ƭ) fungsi yg diaplikasikan pada sampel acak. Selain itu pada bab ini juga
akan menggunakan notasi circumflex (yang biasa dibaca “topi”) sebagai parameter.
Parameter ̂ digunakan untuk membedakan antara nilai parameter yang lain dengan
estimatornya.
Seperti yang telah dibahas pada bab 2, momen pertama sebanding dengan rata-rata =
, yang berarti bahwa momen pertama dari sampel akan sama dengan sampel rata-rata.
Misalkan kasus sederhana yang parameternya tidak diketahui, dikatakan θ = . ̅ =
52
adalah estimator yang beralasan untuk mengestimasi = (θ) digunakan untuk
menyelesaikan ̂ dalam permasalahan = (θ) sebagai estimator dari θ.
Secara umum, metode momen digunakan sebagai estimator dari parameter
dengan nilai ̂ ̂ yang membuat momen populasi sama dengan momen sampel, dengan
kata lain, ̂ ̂ adalah solusi dari persamaan :
(̂ ̂ ) (9.2.3)
Contoh 9.2.1:
Misalkan sampel acak dari distribusi dengan dua parameter yang tak diketahui, mean
dan varians . Diketahui bahwa , merupakan metode momen pertama dan
( ) ( ) , sehingga MMEs adalah solusi dari persamaan ̂
dan ̂ ( ̂ ) , dimana ̂ ̅ dan
( ̅)
̂ ∑ ̅ ∑
Metode Likelihood
Metode Likelihood adalah suatu metode yang mengarah pada sifat-sifat estimator yang
diinginkan, terutama untuk sampel besar, yaitu dengan menggunakan nilai dalam parameter
yang berhubungan dengan “kemungkinan” terbesar untuk data pengamatan sebagai perkiraan
dari parameter yang tak dketahui.
Definisi 9.2.2
Fungsi Likelihood Pdf bersama dari n variabel yang dinilai dengan ,
mengatakan bahwa ( ) tertunjuk sebagai fungsi Likelihood. Untuk
yang tetap, fungsi kemungkinannya adalah sebuah fungsi dari dan sering ditulis dengan
( ).
Jika merepresentasikan sebuah sampel acak dari ( ), maka :
( ) ( ) ( ) (9.2.4)
Definisi 9.2.3
Estimator MaksimumLikelihood.Misalkan ( ) ( ) , adalah pdf
bersama dari . Untuk data pengamatan, ( ), nilai ̂ dalam di mana ( )
maksimum maka disebut Estimator MaksimumLikelihood(MLE) dari . Yaitu, ̂ adalah
nilai dari yang memenuhi :
( ̂) ( ) (9.2.5)
Dalam penerapan fungsi likelihood, ( ) merepresentasikan pdf bersama dari sampel acak,
walaupun kemungkinan maksimumnya juga dapat dipakai dalam kasus lain seperti dalam
order statistik. Jika adalah selang terbuka, dan ( ) dapat diturunkan dan dimisalkan
maksimum pada , maka MLE akan menjadi solusi dari persamaan :
( ) (9.2.6)
Teorema 9.2.1
Sifat Invarian Jika ̂ adalah MLE dari dan jika ( ) adalah sebuah fungsi dari ,
maka ( ̂) adalah MLE dari ( ). 53
Contoh 9.2.7
Misalkan sampel acak dari distribusi eksponensial, ( ). Fungsi kemungkinan untuk
sampel berukuran n adalah
( ) ∑ ⁄
Dengan demikian,
∑ ∑
( ) ( )
persamaan ini disamadengankan nol akan memberikan ̂ ̅
⁄
Jika kita ingin mengestimasi ( ) ( ) , maka kita tahu dari Teorema 9.2.1
bahwa MLE-nya adalah ( ̂) ⁄ ̅
Teorema 9.2.2
Sifat Invarian Jika ̂ (̂ ̂ ) menunjukkan MLE dari ( ), maka MLE
dari ( ( ) ( )) adalah ̂ ( ̂ ̂ ) ( ( ̂) ( ̂)) untuk
Estimator dengan banyak parameter akan tidak sama seperti estimator tunggal ketika
parameter yang lain diketahui.
Contoh 9.2.11
Misalkan sampel acak dari distribusi dengan dua parameter tidak diketahui, ( ).
Pdf populasinya adalah
( )⁄
( ) ( )
Fungi kemungkinannya adalah
∑( )
( ) ( ) [ ]
dengan hasilnya
∑( ̂)
̂ ̅ ̂ ̅
Persentil dari , , sedemikian hingga ( ) diberikan oleh ( ) ,
dan MLE dari adalah ̂ ̂ ( ) ̂ seperti pada Teorema 9.2.2.
54
9.3 Kriteria Untuk Menilai Estimator
Beberapa sifat dari estimator sebagai berikut :
Estimator Unbiased
Definisi 9.3.1
Estimator unbiased. Suatu estimator T dikatakan estimatorunbiased τ(θ) jika memenuhi:
E(T) = τ(θ) (9.3.1)
Untuk semua θ Ω. Jika syarat tersebut tidak dipenuhi maka dikatakan T adalah sebuah
estimator biased dari τ(θ).
Contoh 9.3.1
Diberikan sampel populasi berdistribusi normal dengan mean tidak diketahui, dan variance
Interval parameter Ω = (-∞, ∞), nilai tengah (mean) dari distribusi normal, -∞ < µ <
∞.Akan diestimasi dengan 95% percentil, dalam distribusi N(µ,9). Contoh berikut ini dalam
sebuah fungsi dari parameter,
Karena, ( ) .
Dengan estimator obyektif T = ̅ +4.95 adalah estimator unbias dari ( ),
E(T) = E( ̅ +4.95) = E( ̅ )+4.95 = + 4.95, dengan tidak memperdulikan nilai dari . Hal
tersebut menunjukkan bahwa estimator unbiased memungkinkan untuk dijadikan estimator
biased.
Gambar 9.2
Jika T adalah estimator unbiased dari τ(θ), berdasarkan pertidaksamaan chebychev bahwa
[ ( ) ( ) ] ( ) (9.3.3)
Untuk semua . ini menunjukkan bahwa untuk estimator unbiased, satu dengan varians
yang lebih kecil akan cenderung lebih terkonsentrasi dan dengan demikian mungkin lebih
baik.
Uniformly Minimum Variance Unbiased Estimators (UMVUE)
Definisi 9.3.2
Diberikan adalah sampel acak berukuran n dari ( θ). Sebuah taksiran T* dari
τ(θ) dinamakan (UMVUE) dari τ(θ), jika :
1. T* adalah obyektif untuk τ(θ) dan
2. Untuk taksiran obyektif lainnya T dari τ(θ), Var(T*) ≤ Var (T) untuk semua θ € Ω
55
Contoh 9.3.4
Misalkan sampel acak dari sebuah distribusi eksponen, ( ) karena
( ) ( )= ⁄
Pdf
⁄
ln ( ) = ln
⁄
ln ( )= ln
( )
( )
( )
[ ( )] [( ) ]
Teorema 9.3.1
Jika sebuah estimasi yang unbiaseduntuk τ(θ) ada, variansi yang memenuhi CRLB,maka
hanya sebuah fungsi linearτ(θ) yang dapat dipakai sebagaiestimasiunbiased variannya
memenuhi hubungan CRLB.
Definisi 9.3.3
Efisiensi. Suatu efisiensi relatif dari estimatorunbias T untuk τ(θ) diberikan oleh
( )
( ) (9.3.7)
( )
Suatu estimator unbias T* untukτ(θ) dapat dikatakan efisien jika ( ) untuk semua
estimator unbias T dari τ(θ), dan semua θ ϵ Ω. Efisiensi dari suatu estimatorunbias T untuk
τ(θ) diberikan dengan :
( ) ( ) (9.3.8)
*
Jika T adalah suatu estimator efisien untukτ(θ)
Definisi 9.3.4
Jika T adalah sebuah estimatoruntuk τ(θ), maka bias adalah
b(T) = E(T) - τ(θ) (9.3.9)
dan mean squared error (MSE) dari T adalah
MSE(T) = E[T - τ(θ)]2 (9.3.10)
Teorema 9.3.2
56
Bukti :
( ) [
( )]
[
( ) ( ) ( )]
[
( )] [ ( ) ( )]
[ ( ) ( )] [ ( ) ( )]
( ) [ ( )]
Kesalahan hasil kali rata-rata (MSE) adalah sebuah standar yang dapat beralasan dengan
memperhatikan antara varians dan estimaunbiased.
Definisi 9.4.2
Konsistensi MSE
Jika { } merupakan suatu barisan estimator ( ), dapat dinamakan mean squared error
konsisten dimana
Definisi 9.4.3
Asimtotik Unbiased
Suatu barisan { } merupakan asimtotik unbiased ( ) jika
Teorema 9.4.1
Suatu barisan { } merupakan konsisten MSE jika dan hanya jika unbiased asimtotik dan
( )
Bukti :
Berhubungan dengan teorema 9.3.2
( ) ( ) [ ( ) ( )]
Karena keduanya menunjukkan bagian kanan tidak negatif, ( ) secara tidak
langsung ( ) dan ( ) ( ).
57
Contoh 9.4.1:
Pada contoh 9.3.2, misalkan perbandingan terbalik dari mean sampel, dengan
merupakan estimator ( ) , pada catatan sebelumnya ( ). Dari
persamaan 8.3.6 diperoleh ( ) [ ]( ) dan ( ) [ ] [( ) ],
sehingga ( ) dan ( ) karena .
Teorema 9.4.2
Jika suatu barisan { } merupakan MSE konsisten maka juga merupakan konsisten
sederhana
Bukti :
Dari ketidaksamaan Markov, ( ) dan sehingga
[| ( )| ] ( ) mendekati 1 karena
Teorema 9.4.3
Jika { } adalah konsisten sederhana dari ( ) dan jika ( )yaitu nilai kontinu lain ( ),
maka ( ) adalah konsisten sederhana dari ( ( ))
Definisi 9.4.4
Asymptotic Efficiency
{ } dan { } merupakan dua asimtotik unbiased barisan estimator ( ). Maka asimtotik
relative efisien (are) diperoleh dari
( )
( ) (9.4.4)
( )
urutan { } merupakan asymptotic efficiency jika ( ) untuk semua urutan
asimtotik unbiased { } lain, dan semua . asymptotic efficiency dari urutan asimtotik
unbiased{ } diperoleh dari ( ) ( ) jika { } asymptotic efficiency.
Contoh 9.4.3:
Dari contoh 9.4.1 terdapat ( ), urutan ̅ ditunjukkan asimtotik objektif untuk
[ ]
. Varian adalah ( ) [ ] [( ) ] dan CRLB adalah [ ]
[ ( )]
[ ]
Karena ( ) [ ] [( ) ]
58
4. ̂ merupakan asimtotik efisien
Contoh 9.4.7 :
Misalkan sampel acak dari distribusi pareto ( ) dimana k tidak diketahui. Karena
( ) ( )
selanjutnya
( ) ( )∑ ( )
Dan persamaan ML adalah
( ) ∑ ( )
Didapat MLE
̂
∑ ( )
Untuk mencari CRLB
( ) ( ) ( )
( ) ( )
Sehingga
[ ( )]
Untuk mengevaluasi persamaan diatas dimisalkan dengan transformasi
( ) ( )
Sehingga
[ ( )]
[ ( )] [ ( )]
( ̂)
̂ ( )
59
Definisi 9.5.2
Risk Function
Risk Function didefinisikan menjadi
( ) [ ( )] (9.5.3)
Jika suatu parameter atau fungsi dari parameter akan diestimasi, dapat dipilih loss function
yang bergantung dengan masalah tersebut, dan ketika mencoba untuk menemukan estimator,
risk function dari keduanya adalah kecil untuk semua nilai parameter kemungkinan.
Definisi 9.5.3
Admissible Estimator
Sebuah estimator lebih baik daripada estimator jika dan hanya jika :
( ) ( ) untuk semua , dan
( ) ( ) untuk terakhir
Sebuah estimator T merupakan Admissible estimator jika dan hanya jika tidak ada estimator
yang lebih baik.
Definisi 9.5.4
Minimax Estimator
Definisi 9.5.6
Bayes estimator
Untuk sampel acak ( ), bayes estimator relative untuk fungsi resiko ( )
dan pdf ( ) adalah estimator dengan perkiraan resiko minimum,
[ ( )] [ ( )] untuk setiap estimator (9.5.7)
Definisi 9.5.7
Distribusi Posterior
Kepadatan bersyarat diberikan pengamatan sampel ( ) dinamakan kepadatan
Posterior atau pdf posterior, dan diberikan oleh
( | ) ( )
| ( ) (9.5.8)
∫ ( | ) ( )
60
Teorema 9.5.1
Jika merupakan sampel acak ( | ) maka Estimator bayes adalah estimator yang
meminimalisir kerugian relative nilai harapan distribusi posterior | diberikan oleh
| [ ( )]
Teorema 9.5.2
( ) [ ( )] (9.5.10)
| [ ( )] ∫ ( ) | ( ) (9.5.11)
Contoh 9.5.4:
Misalkan sampel acak berukuran n dari distribusi Bernoulli
Contoh 9.5.4
Berdasarkan sample acak berukuran n dari distribusi bernaulli
( | ) ( )
Dan ( ). Persamaan kepadatan posteriornya
∑
( ) ∑
| ( )
∫ ∑ ( ) ∑
Untuk menunjukkannya menggunakan notasi distribusi beta. Variabel acak Y dari distribusi
beta dengan parameter a dan b, ( )
Pdfnya ( ) ( ) ( ) dimana 0 < y < 1 dan y yang lain 0, dengan
( ) ( ) ( ) ( ). ( ) ( ).
∑ ∑
( )
Untuk menunjukkan distribusi posterior, | ( ) (9.5.12)
(∑ ∑ )
Dengan kata lain, (∑ ∑ ).
∑ (∑ )
Oleh karena itu | ( ) [(∑ ) ( ∑ )] ( )
(∑ )
Kuadrat error kerugian estimator Bayes adalah ( )
Teorema 9.5.3
Estimator Bayes ̂ dari dibawah error kerugian absolute
(̂ ) |̂ | (9.5.14)
Adalah median dari distribusi posterior | ( )
61
Teorema 9.5.4
Jika T* suatu estimator bayes dengan resiko konstan, ( ) maka T* estimator
minimax
Bukti :
Misalkan ( ) ( ), tapi karena ( ) konstanta atas ,
( ) [ ( )] [ ( )]
Untuk setiap T karena T* estimator bayes. Rata-rata dari suatu variable tidak lebih besar dari
nilai maximum variable itu sendiri.
Jadi [ ( )] ( ) dan ( ) ( )
Dimana T* adalah estimator minimax.
Contoh 9.5.6 :
Berhubungan dengan distribusi prior dan posterior dalam contoh 9.5.4, disini kita mencari
bobot kuadrat error kerugian,
( )
( ) (9.5.15)
( )
∑
( ) ( ) ∑
| [ ( )] ∫
( ) (∑ ∑ )
∑ ∑
( )
( )∫ ( )
(∑ ∑ )
Dengan ( ) (∑ ∑ ) (∑ ∑ )
Yang mana mean | [ ( )] minimal saat integral yang terakhir minimal. Integral ini
cocok untuk kondisi biasa ekspektasi kuadrat error kerugian ( ) relatif untuk distribusi
posterior (∑ ∑ ). Dengan teorema 9.5.2, integral ini minimal saat t adalah
mean dari (∑ ∑ ). Berarti ∑ (∑ ∑ ) ̅.
Dimana ( ) dan estimator bayes adalah ̅. Resikonya
[ ] ( )
( )
( ) ( )
SOAL-SOAL LATIHAN
( ) ∫ ( )
62
∫
[ ]
[ ]
( )
∑
( )
̅
̅ ̅
̅ ̅
( ̅) ̅
̅
̂
̅
̅
Jadi MME dari adalah ̂ ̅
2. Dapatkan MME dari sampel random berukuran n dari distribusi ( )
Penyelesaian :
a. ( )
∑
b. ̅
̅
̅
̂
̅
Jadi MME dari ( ) adalah ̂
3. Dapatkan MME dari sampel random berukuran n dari distribusi ( ) dengan
dan tidak diketahui
Penyelesaian :
a. ( )
( ) ̅
̅
̂ ̅
( )
( )
̅
∑
b. ( )
Persamaan a = b
∑
̅
63
∑
̅
∑( ̅)
∑( ̅)
∑( ̅)
√
̂ √
∑( ̅) √( )
p= ̅
E(x) =
̂ ̅
3. ( ) ( ) ( ) ̅
̅
̅
( )
6. Dapatkan MME dari sampel random berukuran n dari distribusi ( ) dengan
tidak diketahui
Penyelesaian :
1. ( )
∑
2. ̅
64
3. (1) = (2)
̅
̅ ̅
Var (x) =
∑
-( )
∑
( ̅ )
∑
̅
∑( ̅)
( )
MME dari ( )
7. Misalkan sampel acak dari distribusi eksponensial, ( ). Fungsi kemungkinan
untuk sampel berukuran n adalah
( ) ∑ ⁄
Dengan demikian,
∑ ∑
( ) ( )
Menyamakan persamaan ini ke nol akan memberikan ̂ ̅ Jika kita ingin
⁄
mengestimasi ( ) ( ) , maka kita tahu dari Teorema 9.2.1 bahwa
MLE-nya adalah ( ̂) ⁄ ̅
( ) ∑ ( )
Didapat MLE
̂
∑ ( )
Untuk mencari CRLB
( ) ( ) ( )
( ) ( )
Sehingga
65
[ ( )]
Untuk mengevaluasi persamaan diatas dimisalkan dengan transformasi
( ) ( )
Sehingga
[ ( )]
[ ( )] [ ( )]
( ̂)
̂ ( )
9. Diberikan populasi berdistribusi normal dengan mean tidak diketahui, namun variance
Interval parameter tepat adalah Ω = (-∞, ∞), karena pada umumnya nilai tengah
(mean) dari distribusi normal, -∞ < µ < ∞. Dengan keinginan untuk menaksir 95%
bagian, dalam distribusi N(µ,9). Contoh berikut ini dalam sebuah fungsi dari parameter,
karena ( ) . diikuti dengan T= ̅ + 4.95 adalah estimator
obyektif dari ( ), karena E(T) = E( ̅ + 4.95) = E( ̅ ) + 4.95 = + 4.95, dengan tidak
memperdulikan nilai dari .
10. Dari contoh sebelumnya terdapat ( ), urutan ̅ ditunjukkan asimtotik
objektif untuk . Varian adalah ( ) [ ] [( ) ] dan CRLB adalah
[ ] [ ]
[ ]Karena
[ ( )] ( ) [ ] [( ) ]
66
BAB X
KECUKUPAN DAN KELENGKAPAN
10.1 PENDAHULUAN
Pada Bab 9 dibahas mengenai penentuan estimasi titik dengan menggunakan sampel
acak untuk mengestimasi parameter yang tidak diketahui pada populasi. Pada beberapa kasus,
hal itu mungkin dapat ditunjukkan bahwa suatu bagian statistik atau himpunan dari statistik
terdiri atas “informasi” pada sampel tentang parameter. Hal tersebut menjadi alasan
pembatasan statistik ketika mengestimasi atau untuk melakukan inferensi tentang parameter.
Jadi informasi dalam suatu sampel akan digunakan untuk melakukan inferensi
tentang parameter.
Pada umumnya istilah dari kecukupan meliputi reduksi suatu himpunan data atau
ringkasan data dari statistik dengan tidak ada informasi yang diketahui dari parameter. Suatu
statistik dinyatakan sebagai suatu “sufficient/kecukupan” statistik untuk suatu parameter
jika distribusi bersyarat dari statistik yang lain diberikan nilai dengan tidak diketahui .
Dengan kata lain, nilai awal dari suatu statistik kecukupan diketahui, nilai amatannya dari
statistik yang lain termuat informasi yang lain tentang parameter.
( )
Jika ∑ maka pdfnya 0. Pada kasus lain, hal itu tidak melibatkan . Selanjutnya
misalkan ( ) untuk statistik lain dan didefinisikan
{( ) ( ) } Pdf bersyarat dari diberikan yaitu:
| ( ) [ ] ∑ | ( ) yang mana juga tidak memuat
67
10.2 STATISTIK KECUKUPAN
Pada bab sebelumnya, suatu himpunan data akan dimodelkan
matematika sebagai nilai pengamatan dari suatu peubah acak . Untuk
memudahkan penulisan digunakan notasi vektor, ( ) dan
( ) nilai kemungkinannya. Dan juga mengikuti kemungkinan dari suatu
vektor-nilai parameter dan vektor nilai statistik dan .
Definisi 10.2.1
Statistik Kecukupan Bersama
Andaikan ( ) merupakan pdf bersama dari ( ) dan
( ) dengan k-dimensi statistik. Kemudian adalah suatu himpunan
statistik kecukupan bersama untuk jika vektor statistik yang lainnya pdf bersyarat dari
diberikan dinotasikan | ( ) tidak bergantung pada . Pada kasus dimensi satu,
dikatakan adalah statistik kecukupan bersama untuk
Bila teramati, penambahan informasi tentang tidak dapat diberikan dari jika
distribusi bersyarat diberikan adalah bebas . Diasumsikan bahwa
adalah suatu sampel acak dari sebuah populasi dengan pdf ( ) dan untuk
memudahkannya sering digunakan vektor ( ) sebagai sampel acak.
Umumnya merupakan vektor lain pada pengamatan peubah acak, seperti sampel sensor
atau himpunan lain dari order statistik.
Tujuan utamanya adalah untuk mereduksi sampel menjadi himpunan terkecil dari
statistik kecukupan atau dapat diartikan sebagai “himpunan minimal” dari statistik
kecukupan. Jika parameter tidak diketahui pada model, maka sering terdapat suatu
himpunan dari statistik kecukupan. Pada beberapa kasus, jumlah statistik kecukupan akan
melebihi jumlah parameter dan pada beberapa kasus tidak ada reduksi pada jumlah statistik
yang mungkin.
Definisi 10.2.2
Suatu himpunan dari statistik dikatakan himpunan minimal kecukupan jika anggota dari
himpunan kecukupan bersama untuk parameter dan jika merupakan sebuah fungsi pada
setiap himpunan lain statistik kecukupan bersama.
68
akan ditunjukkan bahwa | ( ) adalah bebas dari Sesuai pada contoh 10.1.1, dengan
merupakan suatu sampel acak dari distribusi Bernoulli. Bahwa asal mulanya yang sama dapat
digunakan pada banyak situasi yang umum dengan adalah diskrit dan dan adalah nilai
vektor. Andaikan bahwa ( ) dimana ( ) untuk
dan dinotasikan dengan ( ) Dan analog dengan contoh 10.1.1, kondisi
pdfnya dari ( ) diberikan dan ditulis sebagai :
( )
( )
| ( ) { ( ) ( )
Contoh 10.2.1
Andaikan sampel acak dari suatu distribusi eksponensial, ( ). Tentukan estimasi
untuk
Penyelesaian:
Pdf tunggal
( ) ( )
Pdf bersama dari sampel acak
∑
( ) ( )
( )
( )
∑
( ) ( ) ( )
Jika s=∑ maka ( )
( ) ( )
artinya pdf bersyarat tidak tergantung pada kemudian menurut persamaaan (10.2.1)
merupakan statistik kecukupan untuk
69
( ) ( ) ( )
Sehingga menjadi ( ) ( ) ( ) ( )
( )
Atau ( ) ( ) yang mana tidak bergantung pada . Hal ini
( )
menunjukkan sebagai bukti pada teorema di bawah ini.
Teorema 10.2.1
Kriteria Faktorisasi
Jika mempunyai pdf bersama ( ) dan jika
( ) maka adalah statistik kecukupan bersama untuk jika dan
hanya jika
( ) ( ) ( ) ( ) dengan
( ) tidak bergantung pada , kecuali melalui , dan ( ) tidak
bergantung
Contoh 10.2.2
Berdasarkan sampel acak pada contoh 10.1.1, dengan ( ). Sebagai contoh
misalkan ∑ sebagai statistik kecukupan dan secara langsung dengan pdf bersyarat
untuk yang diberikan . Digunakan kriteria faktorisasi untuk menyederhanakan sampel
acak tersebut
∑
( ) ( ) ∑
( )
( ) ( )
Untuk ∑ dan pada kasus ini, didefinisikan ( ) jika semua
atau 1, dan 0 untuk yang lain. Hal tersebut dinotasikan proporsi sampel, ̂ juga
statistik kecukupan untuk Pada umumnya, jika suatu statistik dikatakan kecukupan untuk
maka fungsi satu-satu dari juga kecukupan untuk
Contoh 10.2.3
Andaikan sampel acak berdistribusi uniform, ( ) dengan tidak
diketahui. Gunakan kriteria faktorisasi untuk menyederhanakan sampel acak tersebut!
Penyelesaian:
Pdf bersama untuk adalah
( ) {
Hal tersebut akan lebih mudah jika dituliskan dalam orde statistik minimum dan
maksimum dari .
Sehingga ( )
yang artinya bahwa ( ) ( ) ( ).
70
Dengan ( ) jika dan 0 untuk yang lainnya, dan ( ) jika
dan 0 untuk yang lainnya. Hal tersebut dari bentuk kriteria faktorisasi bahwa order
statistik terbesar statistik kecukupan untuk
Definisi 10.2.3
Jika adalah suatu himpunan, maka fungsi indikator dari , dinotasikan dengan ,
didefinisikan sebagai
( ) {
( ) ( )∏ ( )( )
Contoh 10.2.4
Diberikan suatu sampel acak dari suatu distribusi normal, ( ) dengan dan
tidak diketahui.
Penyelesaian:
Pdf bersama dari distribusi normal diberikan oleh
( ) [ ∑( ) ]
( )
Karena ∑( ) ∑ ∑ misalkan ∑ ∑ ,
( [ ) ( )]
( )
Dan ( ) Maka dengan kriteria faktorisasi, ∑ dan ∑ adalah
statistik kecukupan bersama untuk ( )
( ̅)
Catatan juga bahwa MLE, ̂ ̅ dan ̂ ∑ ( ) , merupakan
pemetaan satu-satu dari dan , sehingga ̂ dan ̂ juga merupakan statistik kecukupan
bersama untuk dan
71
Bukti:
Dari kriteria faktorisasi,
( ,…, ) ( )
) ( ,…, ) (
(10.2.3)
yang merupakan nilai fungsi maksimum likelihood yang bergantung pada s, ̂ ( ) Jika
MLE tunggal maka ̂ menyatakan fungsi dari s.
Contoh 10.3.1
Diberikan diskrit dengan pdf ( ) dan ={0,1}, maka dengan menggunakan fungsi
indikator
( ) ( )( ) ( ) ( )( ) ( ) ( )( )
Jika ( ) ( )( ) ( )( ) ( )( ) maka ( ) kecukupan untuk , dapat
dilihat dengan kriteria faktorisasi
( ) ( )( ) dan ( ) s (ada lebih dari satu MLE)
( ) ( )( ) menghasilkan MLE, ̂ ( )
( ) ( ) menghasilkan MLE, ̂
)( ( )
ini sesuai dengan estimasi maksimum ( ) untuk menetapkan setiap .
̂ bukan fungsi S karena ( ) ( )
( ) , ( )
̂ ( ), ( ) ( ) sehingga ( ) ( )( )
Teorema 10.3.2
Jika S kecukupan untuk maka setiap estimator Bayes menjadi fungsi S.
Bukti:
Fungsi ( , … , ) pada kriteria faktorisasi tidak bergantung pada , sehingga persamaan
9.5.8 Posterior density
( | ) ( )
| ( )
∫ ( | ) ( ) ( )
( ) ( )
∫ ( ) ( ) ( )
Telah disebutkan sebelumnya bahwa order statistiknya adalah kecukupan bersama.
Teorema 10.3.3
Untuk mendapatkan ,…, dan terkait , … ,
Jika , … , sampel acak distribusi kontinu dengan pdf ( ), maka
bentuk order statistiknya himpunan kecukupan bersama untuk .
Bukti:
Untuk mencari ,…,
( ) ( )
( )
dan nol untuk yang lain
( )
72
Secara umum, statistik kecukupan melibatkan UMVUE.
Teorema 10.3.4
Rao-Blackwell.
,…, memiliki pdf bersama ( ) dan =( , … , ) statistik
kecukupan bersama untuk . Jika T estimator unbias dari ( ) dan jika
T*= ( | ), maka
1. T* estimator unbias dari ( )
2. T* fungsi dari S
3. Var (T*) Var (T) untuk semua dan
Var (T*) Var (T) untuk beberapa kecuali jika T*=T dengan
probablitas 1.
Kelengkapan.
Sebuah keluarga dari pdf { ( ) }, disebut lengkap jika [ ( )]
untuk semua maka ( ) dengan probabilitas 1 untuk semua .
Terkadang ditunjukkan dengan tidak adanya estimator unbias nontrivial dari nol.
Maksudnya 2 fungsi berbeda dari T tidak dapat memiliki nilai ekspektasi yang sama. Sebagai
contoh :
[ ( )] ( ) dan [ ( )] ( ), maka
[ ( ) ( )]
( ) ( )
( ) ( )
dengan probabilitas 1, jika keluarga pdf lengkap. Untuk keadaan ini estimator unbias tunggal.
73
Syarat keluarga pdf statistika kecukupan lengkap :
1. Fungsi unbias dari statistik kecukupan harus tunggal
2. Ada UMVUE oleh teorema Rao-Blackwell.
Statistik kecukupan dengan pdf yang anggota keluarganya lengkap disebut statistik
kecukupan lengkap.
Teorema 10.4.1
Bukti:
Fungsi dan estimator unbias ( ) pasti sama dengan T* dengan probabilitas 1. Jika T order
statistik dengan estimator unbias ( ), maka dari teorema Rao-Blackwell ( | ) juga unbias
untuk ( ) dan fungsi , jadi dengan ketunggalan, T*= ( | ) dengan probabilitas 1.
Selanjutnya, Var (T*) Var (T) untuk semua . Dengan begitu T* adalah UMVUE dari ( )
Contoh 10.4.1
Diberikan , … , sampel acak dari distribusi Poisson, ( ),
∑
Pdf : ( )
∏( )
dengan kriteria faktorisasi, ∑ merupakan statistik kecukupan.
( )
dengan , sehingga fungsi ( )
[ ( )] ∑ ( ) ( )
( )
∑
( ) ( )
Karena , agar [ ( )] untuk setiap koefisien harus nol. Jika
maka ( ) . Dengan kelengkapan, ̅ fungsi tunggal dan unbias untuk ( ̅)
maka dari teorema 10.4.1 jelas bahwa ̅ adalah UMVUE dari .
74
Definisi 10.4.2
Kelas Eksponensial.
Suatu pdf dikatakan Regular Exponential Class (REC) jika dapat dinyatakan
dalam bentuk
( ) ( ) ( ) [∑ ( ) ( )] (10.4.1)
Dan nol untuk yang lain, dimana ( ) vektor dari parameter tidak
diketahui-k, jika parameter ruang dalam bentuk
{ | }
( dan ), dan jika memenuhi:
1. Himpunan { ( ) } tidak bergantung pada
2. Fungsi ( ) nontrivial, independen, kontinu dari
3a. Untuk variabel acak kontinu, turunan ( ) tidak bergantung secara
linear pada atas
3b. Untuk variabel acak diskrit, ( ) nontrivial pada atas , dan tidak
ada fungsi linear yang lain.
Contoh 10.4.2
Suatu distribusi Bernoulli, ( )
( ) ( )
( ) { [ ]} { }
Teorema 10.4.2
Jika ,…, sampel acak dari anggota REC( ) maka
∑ ( ) ∑ ( )
Contoh 10.4.3
Pada contoh 10.4.2, ( ). Untuk sampel acak n, ( ) dan
∑ merupakan statistik kecukupan lengkap untuk . Maka UMVUE dengan
Var( ) ( )
Coba (̅ ̅ )
[ ̅( ̅ )] ( ̅) (̅ )
75
[ ̅( ̅ )] ( ̅) [ ( ̅) ( ̅ )]
[ ̅( ̅ )] ( ( ̅)
( )
[ ̅( ̅ )]
[ ̅( ̅ )] ( )( )
[ ̅( ̅ )] ( )( )
[ ̅( ̅) ( )] ( )
̅( ̅
[ ] ( )
( )
Contoh 10.4.4
Jika ( ), maka
( )
( ) [ ]
√
[ ]
√
Untuk sampel acak , ∑ dan ∑ adalah lengkap bersama dan statistik
kecukupan dari dan . Karena MLE fungsi satu-satu dari dan maka bisa digunakan
pada statistik kecukupan lengkap bersama ini.
Teorema 10.4.3
Teorema 10.4.4
Jika CRLB ada, maka ada suatu estimator CRLB untuk beberapa ( ) jika dan
hanya jika pdf anggota REC. Selanjutnya, estimator CRLB dari ( ) menjadi
( ̂), dimana ̂ merupakan MLE dari .
Definisi 10.4.3
Suatu pdf dikatakan anggota Range-Dependent Exponential Class
(RDEC)( ) jika memenuhi kondisi 2 dan 3a atau 3b dari definisi
10.4.2 untuk dan jika dalam bentuk
( ) ( ) ( ) [∑ ( ) ( )]
(10.4.2)
dimana { | ( ) ( )} dan
76
Keadaan khusus meliputi
1. Keadaan satu parameter, dimana ( ) ( ) ( ) dengan
{ | ( ) ( )}
2. Keadaan dua parameter, dimana ( ) ( ) ( ) dengan
{ | ( ) ( )}
Teorema 10.4.5
Diberikan , … , sampel acak dari anggota RDEC( ).
1. Jika , maka , dan dimana
∑ ( ) adalah kecukupan bersama untuk ( )
2. Keadaan dua parameter, dan merupakan kecukupan
bersama untuk ( )
3. Keadaan satu parameter, dan merupakan kecukupan
bersama untuk .
Jika ( ) naik dan ( ) turun, maka
[ ( ) ( )] statistik kecukupan tunggal untuk .
Jika ( ) turun dan ( ) naik, maka
[ ( ) ( )] statistik kecukupan tunggal untuk .
Contoh 10.4.5
Diberikan pdf ( ) {
Teorema 10.4.6
77
Contoh 10.4.6
Distribusi eksponensial dengan 2 parameter, ( )
( ) ( ) ( )
( )
( ) ( ) [ ] ;
( ) ( ) ( ) ;
Jika , … , sampel acak
dari teorema 10.4.6 bahwa dan ∑ adalah statistik kecukupan untuk ( ). ( )
bukan fungsi parameter, jadi tidak terlibat.
Jika diketahui, , maka
( )
( ) ( ) [ ] ;
( )
( ) ( ) [ ] ;
( ) ( )
;
;
kecukupan untuk .
Konsisten dengan hasil sebelumnya, dimana didapat estimator atas yang lebih baik
dari estimator atas statistik lain seperti ̅ .
Teorema 10.4.7
Basu.
Andaikan , … , mempunyai pdf bersama ( , … , ); .
Dimisalkan =( , … , ) dimana , … , adalah kecukupan bersama
untuk , dan statistik lain. Jika distribusi tidak memuat , maka dan
stokastik independen.
Bukti :
Untuk keadaan diskrit, dinotasikan ( ) ( ) dan ( | ) adalah pdf dari , , dan pdf
bersyarat terhadap . Nilai ekspektasi relative terhadap distribusi .
[ ( ) ( | )] ( ) ∑ ( | ) ( )
( ) ∑ ( )
( ) ( )
78
Contoh 10.4.9
Diberikan sampel acak berukuran n dari distribusi Normal, ( ) dan MLE, ̂ ̅
∑( ̅)
dan ̂ . Mudah untuk membuktikan bahwa ̅ statistik kecukupan lengkap untuk
. Untuk menetapkan nilai dari , dari persamaan 8.3.15 maka
( )
( )
∑( ̅)
substitusikan persamaan 8.2.7 yaitu ke persamaan diatas
∑( ̅)
( )
( ) ( )
∑( ̅)
( )
̂
( )
̂
( ) yang tidak bergantung pada .
̅ dan ̂ variabel acak independen.
̅ dan ̂ statistik kecukupan dan kelengkapan bersama untuk dan .
( ̅) ( ̅)
Jumlah dari bentuk ̂
adalah distribusi independen terhadap dan , jadi jumlah ̂
stokastik independen terhadap ̅ dan ̂
RINGKASAN :
Pada bab ini dijelaskan mengenai konsep “kecukupan dan kelengkapan”. Jika statistik
adalah kecukupan, maka memuat semua “informasi” dalam data terhadap parameter yang
tidak diketahui dari distribusi. Jika sebuah statistik adalah kecukupan dan MLE tunggal ada,
maka MLE adalah fungsi statistik kecukupan. Statistik kecukupan juga penting dalam
konstruksi UMVUE. Jika statistik lengkap sebaik kecukupan untuk sebuah parameter, dan
jika estimator unbias dari parameter ada, maka UMVUE ada dan merupakan fungsi statistik
kecukupan lengkap. Kadang sulit untuk dibuktikan kelengkapan secara langsung dari definisi,
tetapi sebuah kelas khusus dari pdf, kelas eksponensial, memberikan cara tepat untuk
memperkenalkan statistik kecukupan lengkap.
SOAL-SOAL LATIHAN
79
Diketahui bahwa ∑ maka diperoleh
( )
∑
( ) ∏
Jika ∑ maka ( ) ∏
Sedangkan 0 untuk yang lainnya. Karena pdf tersebut tidak bergantung pada maka menurut
persamaan 10.2.1 bahwa ∑ adalah statistik kecukupan untuk
80
Sedangkan 0 untuk yang lainnya. Karena pdf tersebut tidak bergantung pada maka menurut
persamaan 10.2.1 bahwa ∑ adalah statistik kecukupan untuk
( ) {
Penyelesaian :
( )
(∑ ∑ ) ∑
( ) ( )( )( )
( )
Karena dapat dinyatakan dalam bentuk faktorisasi maka ̅ adalah statistik kecukupan untuk
81
Karena dapat dinyatakan dalam bentuk faktorisasi maka ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
∑ ( ) adalah statistik
kecukupan untuk
( ) ∏( ( ) ) ( )
( ) ( ) ( )
( ) ( )
( )
( )
( )
Penyelesaian:
( )
( )
( )
a. statistik kecukupan untuk dengan diketahui,
( ) [ ( ) ]
[ ( ) ]
[ ( ) ]
∑
[ ( ) ]
∑ ∑
[ ( ) ] [ ] ∑
( ) [ ]
82
Dan ( ) Maka dengan kriteria faktorisasi, ∑ merupakan
statistik kecukupan untuk .
( ) [ ( ) ]
∑ ∑
Karena [ ( ) ] [ ] ∑
( ) [ ]
Dan ( ) Maka dengan kriteria faktorisasi, ∑ merupakan
statistik kecukupan tunggal untuk . Dan hanya terjadi jika n=1
Penyelesaian:
Distribusi eksponensial dengan 2 parameter, ( )
( ) ( ) ( )
( )
( ) ( ) [ ] ;
( ) ( ) ( ) ;
Jika , … , sampel acak
dari teorema 10.4.6 bahwa dan ∑ adalah statistik kecukupan bersama untuk ( ).
( ) bukan fungsi parameter, jadi tidak terlibat.
Penyelesaian:
( )
( ) ( )
( ) ( )
Untuk sampel acak ,
∏ ∏( )
Adalah lengkap bersama dan statistik kecukupan dari . Karena MLE fungsi satu-
satu dari maka bisa digunakan pada statistik kecukupan lengkap bersama.
83
b. Cari UMVUE dari .
Penyelesaian:
( ).
Untuk sampel acak n, ( ) dan ∑ merupakan statistik kecukupan lengkap
untuk .
a. UMVUE dari Var( ) ( )
Menggunakan (̅ ̅ )
[ ̅( ̅ )] ( ̅) (̅ )
[ ̅( ̅ )] ( ̅) [ ( ̅) ( ̅ )]
[ ̅( ̅ )] ( ( ̅)
( )
[ ̅( ̅ )]
[ ̅( ̅ )] ( )( )
[ ̅( ̅ )] ( )( )
[ ̅( ̅) ( )] ( )
̅( ̅
[ ] ( )
( )
b. UMVUE dari
Menggunakan ̅ ( ̅)
[ ̅( ̅ )] ( ̅) (̅ )
[ ̅( ̅ )] ( ̅) [ ( ̅) ( ̅ )]
[ ̅( ̅ )] ( ( ̅)
( )
[ ̅( ̅ )]
[ ̅( ̅ )] ( )( )
[ ̅( ̅ )] ( )( )
[ ̅( ̅) ( )] ( )
̅( ̅
[ ] ( )
( )
̅( ̅
[ ]
( )
̅( ̅
[ ]
( )
̅( ̅
UMVUE dari adalah [ ]
( )
84
10. Misalkan sampel acak dari Distribusi Poisson, ( ); . Cari UMVUE dari
[ ] .
Penyelesaian:
∑
pdf ( )
∏( )
dengan kriteria faktorisasi, ∑ merupakan statistik kecukupan.
( )
sehingga fungsi ( )
[ ( )] ∑ ( ) ( )
( )
∑
( ) ( )
Karena , agar [ ( )] untuk setiap koefisien harus nol. Jika
maka ( ) . Dengan kelengkapan, ̅ fungsi tunggal dan unbias untuk ( ̅)
maka dari teorema 10.4.1 jelas bahwa ̅ adalah UMVUE dari .
85
BAB XI
ESTIMASI INTERVAL
11.1 PENDAHULUAN
Masalah estimasi titik telah dibahas dalam Bab 9. Selanjutnya, Pada bab ini akan
dijelaskan mengenai estimasi interval, bagaimana mendapatkan nilai sebenarnya dari estimasi
yang diharapkan. Beberapa informasi pada pertanyaan ini disediakan dengan mengetahui
varians atau MSE estimator. Pendekatan lain akan mempertimbangkan perkiraan interval,
bahwa sebuah interval tersebut akan berisi nilai parameter yang sebenarnya.
----------------------------------------------------------------------------------------------------------------
Contoh 11.1.1
Pada contoh 4.6.3, daya tahan hidup yang diamati (dalam bulan) dari 40 sampel lampu
yang diberikan dalam tabel sebagai berikut,
0.15 2.37 2.90 7.39 7.99 12.05 15.17 17.56
22.40 34.84 35.39 36.38 39.52 41.07 46.50 50.52
52.54 58.91 58.93 66.71 71.48 71.84 77.66 79.31
80.90 90.87 91.22 96.35 108.92 112.26 122.71 126.87
127.05 137.96 167.59 183.53 282.49 335.33 341.19 409.97
Tabel 11.1.1
Diasumsikan bahwa data suatu sampel acak berukuran 40 dan berdistribusi eksponensial,
( ), dimana adalah mean (rata-rata). Pada contoh 9.3.4 ditemukan sampel mean ̅
adalah UMVUE dari . Untuk data yang telah diberikan, estimasi dari adalah ̅
bulan. Meskipun diketahui bahwa estimasi ini berdasar pada sebuah estimator sifat yang
optimal, sebuah estimasi titik sendiri tidak memberikan informasi yang akurat. Penyelesaian
dari masalah ini yakni dengan memperoleh interval yang batas atas dan batas bawah yang
mencakup nilai parameter yang sebenarnya diantara yang lainnya dengan probabilitas
mendekati 1.
[̂ ̂ ]=(1 – )100%
Selanjutnya perhatikan Contoh 9.3.2, ̅ ( ) dan diketahui persentil dari
distribusi chi-square telah diberikan pada table 4 (Appendix C). Misalkan dan
dan diperoleh ( ) dan ( ) . Sehingga diperoleh
[ ̅ ] ,
[ ̅ ̅ ]
----------------------------------------------------------------------------------------------------------------
Pada umumnya, sebuah interval dengan batas atas dan batas bawah acak disebut interval
acak. Namun pada contoh 9.3.2 , interval ( ̅ ̅ ) adalah interval acak
dengan nilai parameter yang sebenarnya dengan tingkat kepercayaan 0.95. Jika ̅ diganti
dengan ̅ , maka interval yang dihasilkan ( ). Mengacu pada interval
kepercayaan sebesar 95 % untuk . Dikarenakan estimasi interval telah diketahui memiliki
titik akhir, tidak tepat dikatakan bahwa isi nilai sebenarnya dari dengan probabilitas 0.95.
Bahwa, parameter , yang meskipun tidak diketahui, itu konstan dan pada interval tertentu
86
baik atau tidaknya berisi . Namun faktanya bahwa probabilitas dari interval acak 0.95
menegaskan “95 % kepercayaan” bahwa .
Dalam bab ini juga akan membahas definisi interval kepercayaan dan mendiskusikan
tentang metode umum untuk menurunkan interval kepercayaan
11.2 INTERVAL KEPERCAYAAN
Misal pdf bersama ( ) , dimana adalah sebuah interval.
( ) ( ) adalah statistik, dengan l( ) dan u( ) . Jika
sebuah data percobaan diberikan, maka dapat diamati nilai l ( ) dan
u( ).
Definisi 11.2.1
Notasi lainnya yang sering ditemukan di literatur statistika yakni untuk batas bawah
limit kepercayaan dan batas atas limit kepercayaan. Kadang-kadang digunakan juga notasi
ringkas l( ) l ( ) dan u( ) u( ) untuk pengamatan limit yang
dinotasikan.
Sebenarnya, perbedaan diantara interval acak ( ) dan interval pengamatan
(l( ) u( ) ) dijelaskan sebelumnya. Kondisi ini dianalogikan untuk perbedaan estimasi titik
antara estimator dan estimasinya. Terminologi lainnya, yang mana berguna untuk
mempertahankan perbedaannya disebut ( ) sebuah estimator interval dan (l( ) u( ) )
sebuah estimasi interval, dengan adalah koefisien kepercayaan dan 1- adalah tingkat
kepercayaan.
Mungkin penafsiran yang paling umum dari interval kepercayaan berdasar pada
probabilitas sifat frekuensi relatif. Spesifiknya, jika estimasi interval dihitung dari banyaknya
sampel perbedaan, maka kita berharap di sekitar interval 100 yang termasuk nilai
sebenarnya . Bahwa, kepercayaan kita adalah di metode dan karena Definisi (11.2.1),
tingkat kepercayaan langsung di probabilitas sifat frekuensi.
87
Definisi 11.2.2
1. 1. Jika
[l ( ) ] (11.2.2)
maka l( ) l( ) disebut Batas bawah satu arah 100 limit kepercayaan untuk
2. 2. Jika
[ u( )] (11.2.3)
maka u( ) u( ) disebut Batas atas satu arah 100 limit kepercayaan untuk
Ini mungkin tidak selalu jelas bagaimana memperoleh limit kepercayaan yang memenuhi
Definisi 11.2.1 maupun 11.2.2. Jika sebuah kecukupan tunggal statistik ada, maka satu
kemungkinan untuk menemukan limit kepercayaan yakni fungsi . Disisi lain, statistik yang
lainnya yakni MSE, mungkin diberikan.
----------------------------------------------------------------------------------------------------------------
Contoh 11.2.1 :
Ambil sampel acak yang berukuran n dari distribusi eksponensial, ( ) dan
diharapkan dapat diperoleh batas bawah satu arah limit kepercayaan untuk .
Tentukan interval kepercayaan dengan parameter !
Penyelesaian:
Diketahui bahwa ̅ adalah kecukupan untuk dan juga ̅ ( ). Telah
dijelaskan di bab 8, persentil ke- , ( ) dapat dilihat di tabel 4 (Appendix C). Dengan
demikian,
[ ̅ ( )]
[ ̅ ( ) ]
Jika ̅ dapat diamati, maka batas bawah satu arah limit kepercayaan diberikan oleh
l( ) ̅ ( ) (11.2.4)
Sama halnya, batas atas satu arah limit kepercayaan diberikan oleh
u( ) ̅ ( ) (11.2.5)
Perhatikan bahwa dalam kasus batas atas, harus digunakan nilai ketika membaca tabel 4.
Contoh, jika batas atas 90 % limit kepercayaan diperoleh dari . Untuk
sampel ukuran , persentil yang diperlukan yakni ( ) , sehingga batas
atas limit kepercayaan yakni u( ) ̅ .
Anggaplah bahwa diinginkan limit kepercayaan untuk . Jika dipilih nilai
dan seperti , maka
88
[ ( ) ̅ ( )]
Dan dengan demikian,
[ ̅ ( ) ̅ ( )]
Pada umumnya di misalkan , yang mana diketahui sebagai equal tailed choice dan
akan berarti Sehingga interval kepercayaannya
( ̅ ( ) ̅ ( ))
(11.2.6)
----------------------------------------------------------------------------------------------------------------
Pada umumnya, untuk penentuan tingkat kepercayaan, kita ingin menggunakan metode
yang akan menghasilkan interval dengan mengoptimalkan sifat seperti panjang minimal.
Sebenarnya, panjang, , sesuai dengan interval acak pada umumnya akan menjadi
variabel acak, jadi standar seperti Panjang Ekspektasi Minimum akan lebih tepat. Untuk
beberapa masalah, equal tailed choice dan akan disediakan panjang ekspektasi
maksimum, tetapi tidak untuk yang lain. Contohnya, interval (11.2.6) contoh sebelumnya
tidak memiliki sifat (lihat latihan 26).
Contoh 11.2.2
Diberikan sampel acak dari distribusi normal. ( ), dimana diasumsikan
telah diketahui. Dalam kasus ini, ̅ adalah kecukupan untuk . Tentukan interval
kepercayaan dari !
Penyelesaian:
Telah diketahui √ (̅ ) (0,1). Dari kesimetrian, juga tahu bahwa
, dengan demikian
[ √ (̅ ) ]
[̅ √ ̅ √ ]
Bahwa ( ) interval kepercayaan untuk diberikan oleh
( ̅ √ ̅ √ )
Untuk contoh 95% interval kepercayaan, maka
[ √ (̅ ) ]
[̅ √ ̅ √ ]
[̅ √ ̅ √ ]
Sehingga diperoleh interval kepercayaan untuk
( ̅ √ ̅ √ )
----------------------------------------------------------------------------------------------------------------
Perhatikan permasalahan ini tidak dapat diterima jika tidak diketahui, karena limit
kepercayaan tergantung pada parameter yang tidak diketahui dan tidak dapat dihitung.
Dengan sedikit modifikasi diperoleh interval kepercayaan untuk dan adalah parameter
yang sulit diketahui. Kesulitan utama dalam menentukan interval yang muncul di kasus
89
multiparameter adalah dimana parameter yang sulit diketahui ada. Untuk permasalahan ini
aka nada di bagian selanjutnya.
Di kasus multiparameter mungkin diinginkan “daerah kepercayaan bersama” bahwa
berlaku juga untuk semua parameter secara serentak. Daerah kepercayaan untuk parameter
tunggal, di kasus satu dimensi, akan ada beberapa keadaan selain dari interval. Pada
umumnya, jika , maka daerah lainnya ( ) di adalah 100 daerah
kepercayaan jika probabilitas bahwa ( ) mengandung nilai sebenarnya .
Jika Q = ( ) adalah peubah acak dari suatu fungsi dengan peubah dan
, maka Q dikatakan kuantitas pivot jika distribusinya tidak bergantung dan parameter
yang lain.
----------------------------------------------------------------------------------------------------------------
Contoh 11.3.1
Dalam contoh 11.2.1, terdapat peubah acak yang berdistribusi chi – square dan
̅
kuantitas pivot Q = . Bagaimana mendapatkan Q dari pernyataan probabilitas ke bentuk
batas kepercayaan untuk ?
Penyelesaian :
Jika Q adalah kuantitas pivot untuk parameter dan jika persentil Q dimisalkan
ada sehingga terdapat [ ( )< ]
(11.3.1)
maka untuk sampel yang diselidiki dan daerah kepercayaan untuk sebesar
100 merupakan bagian dari dengan
( )< (11.3.2)
Dengan kata lain daerah kepercayaan tidak akan memerlukan suatu interval. Namun di
sisi lain, terdapat satu keadaan yang penting untuk mendapatkan interval kepercayaan ketika
untuk suatu sampel acak dengan fungsi ( ) adalah monoton naik atau
monoton turun terhadap fungsi. Ini juga mungkin digunakan untuk menentukan distribusi apa
yang akan digunakan untuk mendapatkan kuantitas pivot.
Teorema 11.3.1
Diberikan adalah sampel acak dari suatu distribusi dengan pdf ( ) untuk dan
diasumsikan MLE ̂ ada.
90
Untuk pengertian parameter lokasi dan parameter skala telah dibahas di subbab 3.4
hal.124 pustaka utama dan tentang MLE telah dibahas pada subbab 9.4 hal.316 pustaka
utama tentang sifat sifat asimtotik.
Teorema 11.3.2
Diberikan adalah sampel acak dari suatu distribusi dengan parameter lokasi-skala
( )= ( )
jika MLE ̂ dan ̂ ada, maka ( ̂ ) ̂ dan ̂ adalah representasi dari kuantitas pivot
dan
Perlu diperhatikan bahwa ( ̂ ) yang berdistribusi dengan parameter bebas,
bukan kuantitas pivot kecuali jika diketahui, atau dengan kata lain tidak nol.
----------------------------------------------------------------------------------------------------------------
Contoh 11.3.2
Diberikan sampel acak dari distribusi normal, ( ), dimana dan tidak
̂
diketahui. Jika ̂ dan ̂ adalah MLE (Maximum Likelihood Estimator) maka dan ̂⁄ ̂
adalah kuantitas pivot, maka tentukan interval kepercayaan untuk setiap parameter dengan
mempertimbangkan parameter lainnya!
Penyelesaian :
Seperti yang telah dibahas pada bab 9, MLE akan sesuai untuk menyatakan hasil dari
bentuk estimasi unbias ̂ ( ) dengan mengambil kemudahan dari bentuk
distribusi yang berkaitan dengan ( ), yang telah diketahui berikut.
Jika dinotasikan dengan sampel acak dari ( ), maka distribusi t
̅
( ) (11.3.3)
√
dan distribusi chi-square
( )
( ) (11.3.4)
Jika = ( ) adalah persentil ke ( ) dari distribusi T-Student
dengan derajat kebebasan ( ), maka
̅
[ ]
√
= [ ̅ ]= [̅ ̅ ]
√ √ √ √
sehingga nilai mean dari 100 ( ) terhadap interval kepercayaan untuk adalah
(̅ ̅ ) (11.3.5)
√ √
dengan memperhatikan nilai ̅ dan s
Dengan cara yang sama, jika ( ) dan ( )
adalah masing – masing persentil ke dan dari distribusi Chi-square dengan
derajat kebebasan ( ), maka
91
( )
[ ]
( ) ( )
= [( ) ( )
]] = [ ]
sehingga nilai means dari 100 ( ) terhadap interval kepercayaan untuk adalah
( ) ( )
( ) (11.3.6)
----------------------------------------------------------------------------------------------------------------
Pada dasarnya, jika ( ) adalah interval kerpercayaan dari 100% untuk parameter θ
dan jika τ(θ) adalah fungsi monoton naik terhadap θ Ω maka (τ ( ), τ ( )) adalah interval
kerpercayaan dari 100% untuk parameter τ(θ)
----------------------------------------------------------------------------------------------------------------
Contoh 11.3.3
Dalam contoh 9.2.13 tentang sampel acak berukuran n dari distribusi Weibull
( ) telah dibahas. Untuk soal ini yang ditanyakan adalah tentukan kuantitas pivot
untuk parameter !
Penyelesaian :
Walaupun distribusi Weibull bukan model lokasi-skala, namun tidaklah sulit untuk
menunjukkan bahwa distribusi dari Yi = ln Xi mempunyai suatu nilai ekstrim terhadap
distribusi dalam suatu model lokasi-skala. Secara khusus akan dituliskan sebagai berikut
( )= ( ), dari teorema 11.3.2 (11.3.7)
dimana ( ) ( ). Hubungan antara parameter – parameternya adalah
dan , dengan demikian
̂ ̂
̂
(11.3.8)
dan
̂
̂
(11.3.9)
adalah kuantitas pivot dari
----------------------------------------------------------------------------------------------------------------
Jika ( ) dan jika ( ) adalah CDF dari , dari teorema 6.3.3 hal.201
pustaka utama, tentang probabilitas transformasi integral , maka ( ) ( ) dan
( ) ( ) Untuk sampel acak maka juga bisa didekati dengan
distribusi Chi-Square
∑ ( ) ( )
(11.3.10)
sehingga
[ ( ) ∑ ( ) ( )]
(11.3.11)
92
Jika ( ) fungsi monoton, maka 1 ( ) ( ), maka bisa didekati
dengan
∑ ( ( )) ( ) (11.3.12)
----------------------------------------------------------------------------------------------------------------
Contoh 11.3.4
Diberikan sebuah sampel acak dari distribusi Pareto PAR( ) . Tentukan interval
kepercayaan dari 100( )% !
Penyelesaian :
CDF ( )= 1 – ( ) ,x>0
gunakan persamaan
∑ ( ( )) ( )
( ( )) ( ( –( ) )) = ( ), sehingga
∑ ( ) ( )
sehingga dengan distribusi chi-square interval kepercayan dari dari 100( )% adalah
( ) ( )
( )
∑ ( ) ∑ ( )
----------------------------------------------------------------------------------------------------------------
11.3.1 PENDEKATAN INTERVAL KEPERCAYAAN
Diberikan adalah sampel acak dengan pdf ( ). Berdasarkan penjelasan di
bab 9, MLE normal asimtotik dalam suatu kondisi.
Contoh 11.3.5
Diberikan sampel acak berdistribusi Bernoulli, BIN( ). Tentukan pendekatan
interval kepercayaannya !
Penyelesaian :
MLE dari p adalah ̂ = ∑ . Kita juga tau bahwa ̂ adalah kecukupan dan bahwa
∑ ( ), namun tidak ada kuantitas pivot untuk p, dengan teorema limit pusat
̂
( )
√ ( )⁄
(11.3.13)
untuk sampel berukuran n, mencari interval kepercayaan
̂
[ ]
√ ( )⁄
(11.3.14)
Pendekatan ini dapat ditingkatkan dengan menggunakan koreksi secara kontinu, yang
dibahas pada bab 7, namun di sini tidak ditekankan. Batas untuk suatu pendekatan 100
93
( ) merupakan interval kepercayaan ( ) untuk p yang didapatkan dari
menyelesaikan penyelesaian dari adalah
̂
√ ( )⁄
(11.3.15)
dan penyelesaian dari adalah
̂
√ ( )⁄
(11.3.16)
secara umum
̂
( ) (11.3.17)
√ ( )⁄
saat yang telah ditunjukkan pada contoh 7.7.2 hal.249 pustaka utama, maka untuk
sampel yang berukuran , hasil pendekatannya
̂
[ ]
√ ( )⁄
(11.3.18)
dengan nilai pendekatan interval kepercayaannya
̂ √ ̂( ̂ )⁄ (11.3.19)
----------------------------------------------------------------------------------------------------------------
Contoh 11.3.6
Diberikan sampel acak berukuran n dari distribusi Poisson ( ) . Tentukan
pendekatan interval kepercayaannya !
Penyelesaian :
( ) , dengan Teorema Limit Pusat
̅
( ) (11.3.20)
√ ⁄
94
11.4 METODE UMUM
Jika kuantitas pivot tidak sesuai saat digunakan, maka masih bisa menentukan daerah
kepercayaan untuk parameter jika terdapat data statistik dengan distribusinya yang
bergantung pada parameter , tapi tidak untuk parameter lain yang tidak diketahui. Misal
diberikan dengan pdf bersama ( ) dan S = ( ) ( ).
Lebih baik jika S akan di cukupi terhadap , atau beberapa kemungkinan estimator lain
seperti MLE.
Sekarang untuk setiap kemungkinan nilai diasumsikan bahwa dapat ditentukan nilai
( ) dan ( ) sehingga
[ ( ) ( )] (11.4.1)
Jika memperhatikan S = s , maka bagian dari nilai θ Ω sesuai dengan ( ) ( )
dari daerah kepercayaan 100 ( ) %. Dengan kata lain, jika bernilai benar atau sesuai
dengan , maka akan menjadi daerah kepercayaan jika dan hanya jika ( )
( ), yang mempunyai tingkat kepercayaan 100 ( ) %, karena persamaan [ ( )
( )] sesuai saat dalam kasus ini. Selanjutnya sering dikatakan bahwa
( ) dan ( ) adalah fungsi monoton naik atau monoton turun terhadap , dengan hasil
daerah kepercayaannya berupa suatu interval.
----------------------------------------------------------------------------------------------------------------
Contoh 11.4.1
Diberikan sampel acak berukuran n dari distribusi kontinu dengan pdf
Penyelesaian :
dengan , tidak ada statistik kecukupan tunggal, tapi dan ∑ adalah kecukupan
bersama terhadap . Hal ini diinginkan untuk mendapatkan interval kepercayaan sebesar 90%
untuk menurut statistik S = . CDF dari S adalah
95
----------------------------------------------------------------------------------------------------------------
Fungsi dari ( ) dan ( ) untuk metode umum mengkonstruksi suatu selang
kepercayaan digambarkan pada grafik berikut:
Grafik 11.1
dengan
( ) ( )
dan
( ) ( )
Grafik 11.1 terdiri atas parameter ( ) dan ( ) ,dengan n = 10.
Umumnya jika ( ) dan ( ) keduanya naik, maka titk akhir dari suatu interval
kepercayaan dapat diputuskan dengan meperhatikan sebagai penyelesaian untuk batas
bawah yaitu ( ) dan untuk batas atas yaitu ( ) . Pernyataan bahwa
( ) adalah interval kepercayaan dari 100( ) digambarkan dalam grafik berikut .
Grafik 11.2
96
Teorema 11.4.1
Diberikan statistik S adalah kontinu dengan CDF ( ) dan diberikan ( ) dan ( ) adalah
(11.4.2)
fungsi dengan ( ( ) ; )
(11.4.3)
dan ( ( ) ; )
terhadap θ Ω, dimana 0 < <1 dan 0 < <1. Misalkan suatu nilai yang diperhatikan dari
dan jika ( ) dan ( ) adalah fungsi naik dengan parameter (11.4.4)
, maka pernyataan berikut
beralasan : (11.4.5)
1. Batas bawah satu arah dari 100( ) adalah pendekatan kepercayaan untuk ,dengan
penyelesaian ( )
2. Batas atas satu arah dari 100( ) adalah pendekatan kepercayaan untuk ,dengan
penyelesaian ( )
3. Jika dan 0 < <1, maka ( ) adalah interval kepercayaan 100( )
untuk parameter
----------------------------------------------------------------------------------------------------------------
Contoh 11.4.2
Misalkan sampel acak berdistribusi eksponensial ( ) dan S = ∑ adalah
kecukupan bersama dengan , tentukan ( ) dan ( ) !
Penyelesaian :
Diketahui ( ) dan S = ∑ adalah cukup bersama dengan . Karena S =
∑ adalah cukup bersama dengan , maka 2S/ ( ).
Untuk ( )
[ ( )]= [ ( ) ]
yang berakibat
( )
( ), sehingga ( ) ( ) ( )
ini adalah fungsi naik terhadap dan penyelesaian dari ( ) merupakan batas atas satu
arah dari 100( ) , dengan ( ).
Untuk ( )
[ ( )]= [ ( ) ]
yang berakibat
( )
( ), sehingga ( ) ( ) ( )
ini adalah fungsi naik terhadap dan penyelesaian dari ( ) merupakan batas bawah
satu arah dari 100( ) , dengan ( ).
----------------------------------------------------------------------------------------------------------------
97
Teorema 11.4.2
Diberikan statistik S adalah kontinu dengan CDF ( ) dan diberikan suatu nilai pengamatan
dari S. Jika ( ) adalah fungsi turun terhadap ,maka pernyataan berikut beralasan :
1. Batas bawah satu arah dari 100( ) batas kepercayaan untuk ,dengan (11.4.6)
penyelesaian
( )
(11.4.7)
2. Batas atas satu arah dari 100( ) batas kepercayaan untuk ,dengan penyelesaian
( )
3. Jika dan 0 < <1, maka ( ) adalah interval kepercayaan 100( )
untuk .
Definisi 11.4.1
Suatu pengamatan terhadap interval kepercayaan (θL, θU) disebut konservatif 100 (1- α)%
interval kepercayaan untuk θ jika interval acak cocok memuat nilai yang benar dari θ dengan
probabilitas paling sedikit 1- α
Teorema11.4.3
Misalkan S adalah suatu statistik dengan CDF G (s; θ) dan misalkan h1 (θ) dan h2 (θ) merupakan
fungsi dari G(h1(θ); θ) = α1 dan P[S < h2 (θ); θ] = 1- α2 (11.4.8)
1. Jika h1(θ) dan h2(θ) adalah fungsi naik, maka terdapat suatu batas bawah satu arah
konservatif 100(1-α2)% batas kepercayaan untuk θ, bergantung pada nilai s yang diamati
(11.4.9)
dari S, penyelesaian dari h2 (θL) = s, atau θ = θL seperti P[S <s;θL] = 1- α2.
Suatu batas atas satu arah konservatif 100(1-α1)% adalah batas kepercayaan, yang
merupakan suatu penyelesaian dari h2 (θU) = s, atau G(s; θU) = α1
2. Jika h1 (θ) dan h2 (θ) adalah fungsi turun, maka batas bawah satu arah konservatif
100(1-α2)% yang merupakan penyelesaian dari h1(θL)=s, atau G(s;θL) = α1.
Suatu batas atas satu arah konservatif 100(1-α2)% adalah batas kepercayaan, yang
merupakan penyelesaian dari h2 (θU) = s, atauθ = θU seperti P[S<s; θU] = 1-α2
3. Dalam kasus lain, jika α = α1 – α2 dan 0 <α< 1, maka (θL, θU) adalah suatu interval (11.4.10)
kepercayaan 100(1-α)% yang konservatif untuk θ.
Suatu tingkat kepercayaan kemungkinan tidak diterima jika S adalah fungsi diskrit,
namun tingkat kepercayaan pada dasarnya menyatakan suatu ukuran seberapa besar data
98
tersebut dapat dipercaya. Tentunya ini memerlukan kondisi dalam pertidaksamaan tegas
berikut :
P[S < h2 (θ); θ] = 1- α2;
P[S < s; θL] = 1- α2 ;
P[S<s; θU] = 1- α2
Tentu saja, jika S adalah fungsi kontinu, maka P[S < s; θL] = G(s;θ) dan dari aplikasi
teorema sebelumnya didapatkan tingkat kepercayaan yang eksak.
Untuk mendapatkan kasus dari distribusi diskrit, G(s;θ), dimana hi=(θ) adalah fungsi
naik dan G(s;θ) adalah fungsi turun dari θ. Ambil S nilai diskrit s1, s2,… dan ambil nilai
parameter θ1,θ2,… dengan G(si; θi) = α. Jika diamati bahwa S=si , maka ambil θU=θi sebagai
batas atas 100(1-α)% dari batas kepercayaan. Tingkat kepercayaan akan menjadi lebih dari
1- α untuk nilai tengah dari θ. Jika θi-1<θ<θi maka interval kepercayaannya akan
mengandung θ jika nilai yang diamati dari S itu ≥ si, dengan probabilitas:
P [S ≥ si | θi-1< θ <θi] = 1- G(si-1 ; θ)
≥ 1- G (si-1 ; θ i-1)
=1–α
Dengan cara yang sama, anggap G (si ; θ) = 1- α dan θL = θi-1. Jika S = si, maka θL adalah
penyelesaian dari G(si-1 ; θL) = 1- α. Sekarang pertimbangkan nilai dari θi-1 < θ < θi . Nilai ini
akan menjadi interval kepercayaan jika S dengan probabilitas
P [S ≤ si | θi-1< θ <θi] = G (si; θ)
≥ G (si; θi) = 1 – α
----------------------------------------------------------------------------------------------------------------
Contoh 11.4.4
Dalam contoh 11.3.5, dua pendekatan ditampilkan untuk memperoleh pendekatan
interval kepercayaan untuk parameter binomial p, berdasarkan sampel pendekatan yang
besar. Dapatkan suatu batas konservatif (1 α) 100% batas kepercayaan untuk p dan
dapatkan interval kepercayaan konservatif 90% untuk p, jika diketahui ∑ adalah
statistik kecukupan !
Penyelesaian :
Diketahui bahwa ∑ adalah statistik kecukupan dan S~BIN(n,p). Tidak akan
ditemui pernyataan eksplisit untuk h1(p) dan h2(p) dalam contoh ini, tapi perhatikan bahwa
G(s;p)=B(s;n,p) adalah fungsi naik dari p. Dengan demikian, untuk mencari nilai s,
penyelesaian dari:
( ) ∑( ) ( )
adalah suatu batas atas satu arah yang konservatif dan penyelesaian dari:
( ) ∑( ) ( )
adalah suatu batas bawah satu arah yang konservatif. Jika maka interval
kepercayaan konservatif dari (1 α)100% ditunjukkan oleh ( )
99
Untuk nilai yang lebih spesifik dari s, dapat ditentukan dengan interpolasi
dari tabel komulatif binomial seperti pada Tabel 1 (Appendix C) pada pustaka utama, atau
dapat ditunjukkan dengan penggunaan metode numerik pada CDF. Sebagai contoh, anggap
n=10 dan s= 2. Jika maka B(2;10, 0.507) = 0.05 dan B(2; 10, 0.55) = 0.0274. Hasil
interpolasi linier dengan cara yang sama, jika maka B(1; 10, 0.037) =
0.95 dan hal itu menunjukkan bahwa (0.037, 0.507) adalah interval kepercayaan
konservatif 90% untuk p.
----------------------------------------------------------------------------------------------------------------
Contoh 11.4.5
Ingat kembali cara untuk mendapatkan pendekatan dari interval kepercayaan untuk rata-
rata,μ, menggunakan distribusi Poisson yang telah dibahas di contoh 11.3.6. untuk sampel
acak berukuran n, Xi ~POI(μ), statistik kecukupannya adalah ∑ dan S~POI(nμ).
Tentukan interval kepercayaan konservatif (1 α)100% untuk μ !
Penyelesaian :
Diketahui Xi ~POI(μ), ∑ dan S~POI(nμ), karena CDF distribusi Poisson
berhubungan dengan CDF distribusi chi-square, batas kepercayaan dapat ditunjukkan dengan
baik pada persentil chi-square. Jika ditunjukkan oleh H(y; v) adalah CDF dari variabel chi-
square dengan derajat kebebasan v , maka batas kepercayaan konservatif (1 α)100% untuk μ
dan untuk nilai s yang diamati , adalah suatu penyelesaian dari
( ) ( )
dengan ( )
( )
dan dapat diberikan
dengan cara yang sama, suatu konservatif bawah konservatif (1 α2)100% batas kepercayaan
untuk μ adalah penyelesaian dari
1 α2 G(s – 1; μL) = 1 – H (2n μL; 2s)
sehingga 2n μL = ( ) dan
Jika α1 = α2 = α/2 maka interval kepercayaan konservatif (1 α)100% untuk μ diberikan oleh
( ⁄ ( ∑ )⁄ ⁄ ( ∑ ) ) (11.4.11)
Metode umum ini dapat dipakai dalam berbagai masalah yang berparameter tunggal tidak
diketahui.
----------------------------------------------------------------------------------------------------------------
Teorema11.4.4
Misalkan X1,…,Xn adalah sampel acak berukuran n dari distribusi dengan pdf
(11.4.12)
( ) ( )
100
Ini menunujukkan bahwa metode ini, secara umum dapat digunakan dengan parameter
̂ untuk menentukan batas kepercayaan pada ̂ , dengan ̂1, ̂2 parameter lain yang tidak
diketahui. Tentu saja jika ̂ diketahui, maka kuantitas pivot ( ̂ ) ̂ dan ̂ dapat
digunakan untuk menentukan interval kepercayaan untuk θ1 dan θ2. Teorema 11.3.2 juga
digunakan dalam situasi ini, karena θ1 dan θ2 adalah parameter skala lokasi ketika
diketahui. Hal tersebut tidak boleh diabaikan dalam menghadapi persoalan bagaimana
mendapatkan batas kepercayaan untuk θ1 dan θ2 ketika tidak diketahui
Teorema11.4.5
Misalkan X1,…,Xn adalah sampel acak berukuran n dari distribusi dengan CDF ( )
Dimana θ1 dan θ2 adalah parameter skala posisi dan menunjukkan bahwa MLE ̂ dan ̂ ada.
Jika t adalah nilai pasti, maka F(t; ̂ ̂ ) adalah sebuah statistik yang distribusinya bergantung
pada t, θ1 dan θ2 dalam CDF F(t; θ1; θ2)
Berdasarkan kasus dimana F(x; θ1; θ2) = F0-1 [F(t; θ1; θ2)] dengan F0(z) adalah fungsi
satu-satu pada. Dimisalkan: c = (t-θ1)/ θ2 = Fo-1[F(t; θ1; θ2)]
yang bergantung pada t, θ1 dan θ2 dalam CDF F(t; θ1; θ2) , ini mengikuti bentuk
. ̂1, ̂2) = Fo[(t- ̂1)/ ̂2]
F(t;
= Fo[c(θ2/ ̂2) - ( ̂1 - θ1)/ ̂2]
yang merupakan sebuah fungsi dari c dan kuantitas pivot ( ̂1 - θ1)/ ̂2 dan θ2/ ̂2, sehingga
distribusi bergantung pada F(t; ̂1, ̂2) tapi tidak pada setiap parameter lain yang tidak
diketahui
----------------------------------------------------------------------------------------------------------------
Contoh 11.4.6
Pertimbangkan kuantitas R(t) = P[X > t] = 1 F(t; θ1,θ2)
Dapatkan batas bawah batas kepercayaan (1 α)100% !
Penyelesaian :
R(t) = P[X > t] = 1 F(t; θ1,θ2)
Hal ini adalah kuantitas yang penting dalam suatu aplikasi dimana X menunjukkan waktu
kegagalan atau waktu hidup sebuah percobaan. Dalam suatu aplikasi hal ini disebut fungsi
tahan uji, terkadang juga disebut fungsi bertahan. Hal ini mengikuti teorema sebelumnya
tentang distribusi tahan uji dari MLE. ̂( ) ( ̂ ̂ ) yang bergantung hanya pada
R(t).
Untuk beberapa contoh spesifik, ambil sebuah sampel acak berukuran n dari dua-
parameter yang berdistribusi eksponensial, Xi ~EXP(θ, η). MLE-nya adalah ̂ ̂
̅ dan
̂( ) ( ̂ ̂) [ ( ̂) ̂ ]
[( ) () [ ( ̂ ) ̂]
̂
Jika Y = ̂ ( ) maka dapat ditunjukkan bahwa CDF, G(y; R(t)) naik di R(t) untuk setiap y.
Dengan demikian, berdasarkan teorema 11.4.2, batas bawah satu arah untuk batas
101
kepercayaan (1 α)100%, diperoleh dengan penyelesaian ( ̂( ) ( )) Untuk
menentukan ̂ ( ) sedikit rumit dalam kasus ini.
----------------------------------------------------------------------------------------------------------------
11.5 MASALAH DUA SAMPEL
Sering dijumpai suatu sampel acak diambil dengan tujuan untuk membandingkan dua
atau lebih populasi. Hal ini menarik dalam membandingkan bentuk mean dari dua proses atau
variasi yang relatif dalam dua proses. Interval kepercayaan di sini digunakan untuk
perbandingan yang berkaitan dengan batas atas dan batas bawah.
11.5.1 PROSEDUR DUA SAMPEL NORMAL
Pertimbangkan sampel acak independen berukuran n1 dan n2 dari dua populasi yang
berdistribusi normal masing-masing Xi~N ( ) dan ( ). Ini berarti bahwa ̅ dan
̅ adalah sampel rata – rata, sedangkan dan adalah dan sampel variasi.
Pada dasarnya estimator titik unbias dapat dihitung, tapi jika hanya ada
perbedaan estimasi yang kecil, maka mungkin saja itu tidak jelas, apakah hasil perbedaan
dari perbedaan yang sebenarnya dalam variansi, atau apakah hasil perbedaan dari galat
sampel acak. Dengan kata lain, jika variansi distribusi tersebut sama, maka perbedaan sampel
variansi berdasarkan lebih dari dua sampel, kemungkinan diperlukan petunjuk yang berbeda.
Perhatikan juga jika ukuran sampel besar, maka akan memperlihatkan suatu perbedaan kecil
antara estimasi yang dapat mengindikasikan perbedaan nilai parameter juga; tetapi jika
ukuran sampel kecil, maka perbedaan yang besar hampir mungkin hasil dari peluang. Interval
kepercayaan mendekati penggabungan pada suatu estimasi interval.
( ⁄ ( – ) ⁄ ( – ))
(11.5.3)
----------------------------------------------------------------------------------------------------------------
Contoh 11.5.1
Sampel acak dengan ukuran n1= 16 dan n2=21 dengan estimasi dan
dan 90% interval kepercayaan diinginkan. Tentukan interval kepercayaan 90% untuk
!
102
Penyelesaian :
Dengan menggunakan hubungan ( ) , dan dari tabel 7 appendix C
( )
didapat ( ) ( ) ⁄ ( ) =0,429. Hal
tersebut menunjukkan bahwa (0.143, 0.733) adalah 90% interval kepercayaan untuk .
Karena intervalnya tidak memuat nilai 1, dapat disimpulkan bahwa
dan dua populasi tersebut memiliki variansi yang berbeda. Karena tingkat kepercayaannya
90%, jika hanya 10% hasil akhirnya, maka dalam rata-rata akan salah.
Dengan Z, pernyataan P[-z1-α/2 < Z < z1-α2]=1 – α dapat diselesaikan dengan mudah untuk
menghitung batas kepercayaan (1 α)100%, yaitu
̅ ̅ √
(11.5.6)
Jika maka diasumsikan sebagai suatu varians gabungan
( ) ( )
(11.5.7)
( )
dan jika mengasumsikan , (11.5.8)
maka diperoleh hubungan
( ) ( )
( ) (11.5.9)
Jadi benar bahwa ̅ ̅ bebas dari dan sehingga dengan Z diberikan oleh persamaan
̅ ̅ ( ) ( )
( ), dengan dan V diberikan oleh
√
̅ ̅ ⁄ ( ) √ (11.5.11)
----------------------------------------------------------------------------------------------------------------
103
Contoh 11.5.2
Sampel acak dengan ukuran n1 = 16 dan n2 =21 berestimasi ̅ ̅
dan .Dapatkan suatu interval kepercayaan 90% untuk rasio dua varians yang
bertujuan memeriksa asumsi persamaan varians dengan menggunakan prosedur untuk mean!
Penyelesaian :
Interval kepercayaan 90% untuk adalah (0,358 , 1,83). Dengan demikian, tidak
ada bukti kuat bahwa suatu varians tidak sama dan akan diasumsikan bahwa .
Estimasi variansnya adalah
( ) ( )
( )( ) ( )( )
= 0, 109
dan didapat = 0,330.
Misalkan bahwa 95% interval kepercayaan untuk diinginkan. Dengan interpolasi
linear antara t0,975(30) = 2,042 dan t0,975(40) = 2,021, dalam tabel 6 (Appendix C) pustaka
utama, didapatkan juga t0,975(35) = 2,032. Interval kepercayaan berdasarkan batas dalam
persamaan
̅ ̅ ⁄ ( ) √
(11.5.12)
Persamaan ini digunakan untuk sampel besar.
Adapun untuk sampel kecil dari distribusi normal, distribusi dari variabel acak dalam
persamaan di atas bergantung pada dan , tapi pendekatan yang baik dalam sampel kecil
digunakan distribusi-t dengan persamaan berikut
̅ ̅ ( )
( )
√
(11.5.13)
dimana derajat kebebasannya adalah
( )
(11.5.14)
[( ) ⁄( )] [( ) ⁄( )]
104
11.5.5 PROSEDUR SAMPEL BERPASANGAN
Andaikan terdapat sebuah sampel acak dari n pasang, (Xi, Yi) dan diasumsikan bahwa
Di = Yi – Xi untuk i=1, …, n adalah distribusi Normal dengan mean dan
variansi atau Di ~ N ( )
Misalkan ̅ ∑ ̅ ̅ (11.5.15)
dan
∑ (∑ )
( )
(11.5.16)
Berdasarkan hasil di Bab 6 bahwa
̅ ( )
⁄√
( )
(11.5.17)
dengan demikian interval kepercayaan (1 ) 100% untuk mempunyai batas :
̅ ⁄ ( ) √
(11.5.18)
dimana ̅ dan sD diketahui.
Perhatikan bahwa metode ini valid jika sampelnya bebas, karena pada kasus ini
( ) bagaimanapun, derajat kebebabasan dalam sampel berpasangan
adalah n 1, sedangkan dalam kasus sampel bebas dengan diperoleh suatu t statistik
dengan derajat kebebasan 2n 2. Oleh karena keefektifan ukuran sampel adalah dua kali dari
sampel bebas maka metode sampel berpasangan kurang baik digunakan. Bagaimanapun, jika
ada alasan ada suatu sampel yang berpasangan dan pasangannya memiliki korelasi yang
tinggi, maka lebih kecil dari dan ini dapat merugikan
keefektivan ukuran sampel.
Hal yang menarik untuk dicatat bahwa jika dua sampel bebas memiiliki ukuran yang
sama dengan variansi yang berbeda, maka prosedur sampel berpasangan masih dapat
digunakan untuk menentukan suatu t statistik dengan syarat perbedaan hasil interval akan
cenderung menjadi lebih luas daripada saat menaksir variabel seperti persamaan 11.5.13.
Ini jelas bahwa pendekatan batas kepercayaan untuk sampel besar dengan parameter
dapat digunakan dalam suatu ketentuan seperti kasus dalam sebuah sampel, dengan
̂ ( ̂ ) ̂ ( ̂ )
̂ ̂ √ (11.5.20)
105
11.6 ESTIMASI INTERVAL BAYES
Estimasi Bayes telah didiskusikan secara singkat di bab 9 untuk kasus estimasi titik.
Dalam pembahsannya suatu parameter diperlakukan dengan kasus variabel acak yang sesuai
secara matematis. Contohnya parameter yang digunakan sebagai variabel kondisi yang
tentunya berbeda, dalam suatu eksperimen. Prior density, ( ) mungkin dipertimbangkan
untuk memberikan hasil yang sesuai yang berkaitan dengan nilai parameter yang benar dan
struktur Bayes menyediakan kerangka yang cocok untuk menggunakan ( ) yang sesuai
kepercayaan untuk mengatasi suatu fungsi kendala dengan memilih estimasi terbaik (kendala
yang lebih kecil). Dalam kasus ini, prior density tidak berbeda dari interval kepercayaan .
Ketika nilai beragam dari 0 sampai hasil interval kepercayaan untuk ,dapat
direpresentasikan saat menentukan distribusi peluang untuk . Distribusi dalam kasus ini
berdasarkan pada beberapa data yang berkriteria subyektif.
Dalam berbagai persoalan, andaikan prior density ( ) ada atau bisa dimasukkan dalam
permasalahan dan ( ) di gunakan juga dalam pdf bersyarat ( | ). Misalkan lagi
posterior density dari diberikan oleh sampel ( ),
( | ) ( )
| ( ) (11.6.1)
∫ ( | ) ( )
Prior density ( ) dapat digunakan sebagai suatu kemungkinan inisial yang spesifik dari
suatu distribusi untuk nilai yang sesuai dan pada kaitannya | ( ) akan direpresentasikan
sebagai distribusi yang sesuai dengan variabel acak yang diamati. Untuk tingkat ,
interval kepercayaan Bayes untuk yang diberikan oleh (θL, θU), dengan θL dan θU adalah
batas untuk
∫ | ( )
(11.6.2)
Jika adalah variabel acak yang benar, maka interval Bayes akan biasa saat dinyatakan
sebagai “Interpretasi Peluang”. Tentu saja, dalam banyak kasus, hasil yang benar hanya untuk
menunjukkan bahwa model yang diasumsikan benar. Jika ( ) adalah representasi dari
tingkat kepercayaan terhadap nilai , maka mungkin interval (θL, θU) juga direpresentasikan
dalam tingkat kepercayaan juga.
----------------------------------------------------------------------------------------------------------------
Contoh 11.6.1
Pada Contoh 9.5.5, dimisalkan bahwa Xi ~ POI (θ) dan θ ~ GAM(β, κ). Tentukan
Interval kepercayaan Bayes untuk θ jika diberikan oleh batas bawah dan batas atas
(θL, θU) !
Penyelesaian :
Distribusi posterior dari θ ~ GAM(β, κ), didapatkan persamaan
| [( ⁄ ) ∑ ] (11.6.3)
yang menunjukkan bahwa
106
( ⁄ ) [ (∑ )]
( ⁄ )
(11.6.4)
dan P[χ 2α / 2(v) < 2(n+1/β)θx< χ1-α/22 (v)] = 1 α (11.6.5)
dengan (∑ ), maka
100(1- α)% interval kepercayaan Bayes untuk θ diberikan oleh batas bawah dan batas atas
(θL, θU) dimana batas bawah θL = χ 2α / 2(v) / 2(n+1/β) dan batas atas θU = χ1-α/22 (v)/ 2(n+1/β).
RINGKASAN
Tujuan penting dari bab ini adalah untuk memperkenalkan konsep sebuah estimasi
interval atau interval kepercayaan. Suatu estimator titik sendiri tidak memberikan keakuratan
nilai. Suatu estimator interval memberikan penyelesaian yang mungkin untuk masalah ini.
Konsep ini melibatkan suatu interval yang titik akhirnya statistik dan termasuk nilai yang
benar dari parameter antara batas-batasnya dengan probabilitas tinggi. Probabilitas ini cocok
untuk tingkat kepercayaan dari estimator interval. Biasanya, instilah interval kepercayaan
(atau estimasi interval) memiliki arti pengamatan interval yang dihitung dari data.
Terdapat dua metode dasar untuk membangun interval kepercayaan. Metode yang
pertama, yang berguna di beberapa aplikasi dimana terdapat parameter yang tidak diketahui.
Meliputi dari dugaan kuantitas pivot. Jumlah ini digunakan untuk menemukan variable acak
yang berupa fungsi dari perhitungan variable acak dan parameter kepentingan, namun tidak
untuk parameter lain yang tidak diketahui. Hal ini juga dibutuhkan bahwa distribusi dari
kuantitas pivot adalah bebas dari parameter yang tidak diketahui. Dalam kasus ini, parameter
lokasi – skala, kuantitas pivot dapat dinyatakan dalam bentuk MLE jika ada. Pendekatan
kuantitas pivot untuk sampel besar dapat dasarkan pada hasil dari distribusi normal asimtotik
dalam beberapa kasus.
Metode lain, yang disebut metode umum, tidak memerlukan eksistensi dari kuantitas
pivot, tapi metode umum mempunyai kerugian yaitu tidak bisa digunakan saat parameter lain
menjadi kendala ada. Metode ini dapat digunakan dengan statistik, yang distribusinya dapat
ditunjukkan dalam bentuk parameter. Parameter mempunyai fungsi yang disebut dengan
persentil dan batas dari interval kepercayaan didapatkan dengan menyelesaikan persamaan
yang jelas memerlukan persentil dan statistik dari nilai yang diestimasi. Interval dari estimasi
itu sendiri didapat dengan kedua metode yang bisa diinterpertasikan dalam bentuk frekuensi
relatif dengan nilai parameter yang benar dan mencakup suatu interval, sehingga
berhubungan atau korespondensi dengan peluang, pada akhirnya interval dari estimasi akan
mencakup nilai yang benar. Bentuk suatu interval yang lain dapat didekati dengan
pendekatan Bayes. Pendekatan ini menyediakan langkah yang sesuai dalam menggunakan
informasi yang diketahui.
107
SOAL-SOAL LATIHAN
, , ̅
Untuk interval kepercayaan, maka
[ √ (̅ ) ]
[̅ √ ̅ √ ]
[ ( √ ) ( √ )]
[ ( ) ( )]
[ ]
b. Berdasarkan pada informasi (a), tentukan batas bawah satu arah limit
kepercayaan untuk . Juga tentukan batas atas satu arah limit kepercayaan
untuk .
Penyelesaian :
Batas bawah satu arah limit kepercayaan yakni
[l( ) ]
l( ) l ( )
l( )
Batas atas satu arah limit kepercayaan yakni
[ u( )]
u( )u( )
u( )
c. Untuk interval kepercayaan yang diberikan oleh ekspresi (11.2.7), memperoleh rumus
ukuran sampel wajib menghasilkan panjang spesifik dari sebuah interval. Jika
, maka apa ukuran sampel yang dibutuhkan untuk mencapai interval
kepercayaan dengan panjang 2 ?
Penyelesaian :
Ekspresi (11.2.7) yakni
( ̅ √ ̅ √ )
108
Untuk interval kepercayaan, maka
√ (̅ )
√ (̅ )
√ (̅ )
( )( ) √ (̅ )
√ (̅ )
( )
, , ̅ ,
Untuk interval kepercayaan, maka
(̅ )
[ ]
√
[̅ √ ̅ √ ]
[ √ √ ]
[ ( √ )
( √ )]
[ ( ) ( )]
[ ]
( )( ) ( )( )
[ ]
109
[ ]
( )
( )
3.Misal sampel acak dari distribusi eksponensial ( )
a. Jika ̅ dengan , tentukan batas bawah satu arah 95 % limit
kepercayaan untuk
Penyelesaian :
Untuk interval kepercayaan dengan
[ ̅ ( ) ]
l( ) ̅ ( )
( )( ) ( ( ))
( )
⁄
b. Tentukan batas bawah satu arah 95 % limit kepercayaan untuk ( )
dimana adalah sebuah nilai arbitrary yang diketahui.
Penyelesaian :
[ ̅ ( ) ]
l( ) ̅ ( )
( )( ) ( ( ))
( )
⁄
Untuk ( ) maka dapat diperoleh batas bawah satu arah 95 % limit
⁄
kepercayaan adalah
4.Data berikut adalah waktu (per jam) gangguan peralatan AC di bagian pesawat terbang:
Asumsikan bahwa data adalah nilai yang diamati dari sampel acak berdistribusi
exponensial ( )
a. Tentukan 90 % interval kepercayaan untuk rata-rata waktu gangguan,
Penyelesaian :
Dari data yang diberikan, dapat diperoleh
110
Untuk interval kepercayaan, maka
[ ( ) ̅ ( )]
[ ̅ ( ) ̅ ( )]
[ ( )( ) ( ( ))
( )( ) ( ( ))]
[ ( ) ( )]
[ ]
Sehingga diperoleh interval kepercayaan untuk
( )
( )
b. Tentukan batas bawah satu arah limit kepercayaan untuk 10th persentil dari
distribusi waktu gangguan.
Penyelesaian :
Untuk interval kepercayaan dengan 10th persentil maka
[ ̅ ( ) ]
l( ) ̅ ( )
( )( ) ( ( ))
( )
6. Misal X1,…, Xn adalah sampel acak dari distribusi Eksponensial dua parameter,
Xi~EXP(θ,η).
b. dengan menggunakan data pada Latihan 5, tentukan batas bawah 95% interval kepercayaan
untuk θ.
Penyelesaian:
( )
a. Pdf: f(x; θ,η ) = Xi~EXP(θ,η).
(∑ )
η = 150 sehingga f (x; ) =
111
Xi – 150 ~ EXP (θ,η).
∑ ( )
( )
∑
Jadi, adalah kuantitas pivot.
1–α=P[ ( )]
=P[ ]
( )
(∑ )
=P[ ]
( )
= P [578,117<θ]
Penyelesaian :
Diketahui : adalah contoh acak
distribusi Weibull ( ).
( )
pdf : ( β) = untuk x > 0, dan 0 untuk x yang lain
( )
maka ( 2) =
( )
untuk ( 2) = ∑
[ ̅ ( )]
112
[ ̅ ( ) ]
Jika ̅ dapat diamati, maka batas bawah satu arah limit kepercayaan diberikan oleh
l( ) ̅ ( )
Sama halnya, batas atas satu arah limit kepercayaan diberikan oleh
u( ) ̅ ( )
Q= ∑ ( )
Q= ∑ ( ) (telah ditunjukkan)
b. Menentukan interval kepercayaan 100 % terhadap θ dengan menggunakan Q
Q= ∑ ( )
∑ ( )
Anggaplah bahwa diinginkan γ limit kepercayaan untuk . Jika dipilih nilai γ dan
γ seperti γ γ γ γ, maka
[ γ
( ) ∑ ( ) γ
( )] γ γ
dengan demikian,
[ ∑ γ
( ) ∑ γ
( )] γ
√ ∑ γ
( ) √ ∑ γ
( ) γ
[ ]
∑ ∑
(√ √ )
γ
( ) γ
( )
113
c. Batas bawah limit kepercayaan 100 % untuk ( ) [ ( ) ]
( γ
)
( γ
[ ( ) ]) ( γ
[ ( ) ])
( γ
[ ( ) ])
( γ
[ ( ) ])
[ ∑ ∑
]
[ ∑ ∑
]
[√ ∑
√
∑
]
9. Gunakan pendekatan pada contoh 11.3.4 jika diberikan sampel acak dari distribusi Pareto
PAR( ) dengan mengambil data dari contoh 4.6.2 yang diberikan sebagai berikut
0,85 1,08 0,35 3,28 1,24 2,58 0,02 0,13 0,22 0,52
0,02 0,13 0,22 0,35 0,52 0,85 1,08 1,24 2,58 3,28
114
Penyelesaian
Diketahui
PAR( )
pdf :
( θ ) dengan
θ( )
θ
CDF ( )= 1 – ( ) ,x>0
gunakan persamaan
κ∑ ( ( )) ( )
( ( )) ( ( –( ) )) = ( )
sehingga
∑ ( ) ( )
0,85 1,08 0,35 3,28 1,24 2,58 0,02 0,13 0,22 0,52 ∑ ( )
( ) 0,615 0,732 0,3 1,454 0,807 1,275 0,02 0,122 0,199 0,419 5,943
sehingga dengan distribusi chi-square interval kepercayan dari dari κ dengan daerah =
0,95 adalah
[ ∑ ( ) ]
= [ ] = [ ]
berdasarkan tabel distribusi chi square diperoleh interval kepercayaan 95% terhadap κ adalah
κ = (0,81;2,88)
11. Andaikan adalah proporsi orang Amerika Serikat yang berambut merah.
Dalam suatu sampel berukuran 40, ditemukan 5 orang berambut merah
Dapatkan pendekatan 90% dari interval kepercayaan terhadap
115
Penyelesaian
̂
sehingga (koefisien kepercayaan)
√ ̂( ̂)
√ ( )
√ ( )
diperoleh ( )
Jadi pendekatan 90% dari interval kepercayaan terhadap adalah ( )
12. Terdapat 45 pekerja pemintalan tekstil yang dipilih secara acak untuk mempelajari tingkat
kecelakaan kerja yang terjadi. Angka kecelakaan tiap pekerja diasumsikan berdistribusi
poisson dengan mean , sedangkan nilai rata – rata kecelakaan tiap pekerja adalah
̅
a. Dapatkan pendekatan dari batas bawah sebesar 90% terhadap limit kepercayaan untuk
menggunakan persamaan 11.3.20
b. Gunakan perintah pada soal a, jika diselesaikan dengan persamaan 11.3.21
116
Penyelesaian
Diketahui : n = 45 , ̅
sehingga (koefisien kepercayaan)
( )
akan didapatkan dengan pendekatan sesuai persamaan 11.3.20
̅
( )
√ ⁄
̅
( )
√( ̅ ⁄ )
a. Dengan persamaan 11.3.20
√ ⁄
̅
Jadi ( )
b. Dengan persamaan 11.3.21
̅
√( ̅ ⁄ )
̅
√( ̅ ⁄ )
√( ⁄ )
117
Jadi ( )
19. Diberikan sampel acak independen dari dua distribusi normal, Xi~N ( ) dan
( ).
Penyelesaian
Diketahui : Ada dua sampel acak independen berdistribusi normal
Xi~N ( ), ( ).
i = 1,…, j=1,…,
dan diketahui
̅ ̅ ( )
̅ ̅
< ̅ ̅
( ) ( )
√
(̅ ̅
) < (̅ ̅
)
( ) ( )
(̅ ̅
) < (̅ ̅
)
( ) ( )
118
dengan syarat statistik kecukupan pertidaksamaan di atas dapat diubah menjadi
( (̅ ̅
) )< (( ̅ ̅
) ),
( ) ( )
( ( (̅ ̅
) ) (( ̅ ̅
) ))
( ) ( )
namun yang sering dijumpai dalam persoalan, interval kepercayaan untuk didapatkan
dengan menggunakan distribusi F Snedecor.
18. Misal X1,…, Xn adalah sampel acak dari distribusi Normal, X~N(μ,σ2). Jika t adalah
bilangan asli, temukan statistic yang merupakan statistic kecukupan dan distribusi yang
bergantung pada t, μ,σ2 hanya jika F(t; μ,σ2) = P (X≤t)
Penyelesaian:
Misal :
( )
c σ2 =
t = c σ2
jika ̂ dan ̂ adalah MLE dari dan σ2 yang mana bergantung pada t, μ,σ2
̂
F0 = ( ̂
)
( ̂)
F0 = ( ̂ ̂
)
Yang mana adalah fungsi dari c dan kuantitas pivot untuk μ dan untuk σ2 yang bergantung
pada F(t; μ,σ2) = P(X≤ t)
119
BAB XII
UJI HIPOTESIS
12.1 PENDAHULUAN
Dalam kegiatan ilmiah, banyak perhatian yang ditujukan untuk menjawab pertanyaan
tentang kevalidan teori atau hipotesis tentang fenomena fisik. Apakah obat yang baru
efektif?. Biasanya, informasi tentang fenomena tersebut hanya dapat diperoleh dengan
menunjukkan percobaan yang hasilnya mempunyai beberapa langkah dalam menarik
hipotesis. Syarat uji hipotesis akan mengacu pada proses mencoba untuk memutuskan benar
atau salah hipotesis tersebut berdasarkan bukti eksperimen.
Misalnya, diduga bahwa suatu hipotesis tertentu, mungkin sebuah teori yang diterima,
adalah salah, dan dilakukan percobaan. Hasil yang tidak konsisten dengan hipotesis akan
meragukan kevalidannya. Misalnya, hipotesis yang akan diuji dapat menentukan bahwa suatu
konstanta fisika memiliki nilai . Pada umumnya pengukuran eksperimen berdasarkan pada
kesalahan acak, dengan demikian keputusan tentang benar atau salah dari hipotesis,
berdasarkan pada bukti eksperimen, juga berdasarkan pada kesalahan. Tidak akan mungkin
untuk menghindari kesalahan keputusan, tetapi akan mungkin untuk membuat uji kesalahan
tersebut jarang terjadi.
contoh 12.1.1 menggambarkan konsep uji hipotesis
Sebuah teori mengemukakan bahwa hasil dari suatu reaksi kimia berdistribusi normal ,
( ). Percobaan sebelumnya menunjukkan bahwa jika mineral tertentu tidak
diberikan, dan jika mineral diberikan. Percobaan akan mengambil dari sampel acak
berukuran . Dalam dasar dari sampel tersebut, akan coba diputuskan mana kasus yang
benar. Hal ini ingin di uji menggunakan “hipotesis nol “ dengan
“hipotesis alternatif”
Definisi 12.1.1
Sebuah hipotesis statistik subset dari ruang parameter. Tujuan dari Uji akan memutuskan
apakah nilai sebenarnya dari parameter. Demikian, hipotesis nol subset dari Ω dan
hipotesis alternatif, Ω - . Dalam kasus hipotesis sederhana, { } dan Ω - { },
dimana . Kebanyakan percobaan atau penelitian hipotesis mempunyai beberapa
tujuan yang salah satu harapannya untuk mendukung hipotesis alternatif dengan bukti
statistik. Pada contoh 12.1.1, jika ada bukti kuat bahwa mineral diberikan, maka
dimungkinkan akan menghabiskan sejumlah besar uang untuk memulai pertambangan, jadi
kasus ini diselesaikan dengan hipotesis alternatif. Sekarang harus mempertimbangkan data
sampel, dan memutuskan berdasarkan data apakah ada bukti kecukupan Statistik untuk
menolak , mendukung alternatif atau tidak ada bukti yang cukup. Caranya adalah
120
dengan membagi ruang sampel menjadi dua daerah, "daerah kritis" atau " daerah penolakan"
, dan daerah penerimaan . Jika data sampel yang diamati jatuh pada , maka akan
menolak dan jika tidak jatuh pada , maka menerima .
Definisi 12.1.2
daerah kritis untuk uji hipotesis adalah himpunan bagian dari ruang sampel yang sesuai
untuk menolak hipotesis nol
Pada contoh , ̅ adalah statistik kecukupan untuk , menyatakan daerah kritis secara
langsung dengan syarat variabel tunggal ̅ , ̅ sebagai uji statistik. Karena , bukti
langsung untuk daerah kritis pada masalah ini diberikan {( ) ̅ }, untuk
beberapa konstan c. Akan menolak jika ̅ , dan akan menerima jika ̅ .
Terdapat dua kemungkinan kesalahan yaitu akan menolak ketika benar, atau menolak
ketika salah. Kesalahan-kesalahan itu adalah:
1. Kesalahan tipe I : menolak kebenaran
2. Kesalahan tipe II : menerima padahal salah.
Diharapkan untuk memilih statistik uji dan daerah kritis agar dua tipe kesalahan di atas
memiliki peluang kecil, ada dua peluang yaitu:
1. [ ] [ ]
2. [ ] [ ]
,
Gambar 12.1. Peluang kesalahan tipe I dan tipe II
Definisi 12.1.3
121
Pada sederhana tingkat kepercayaan juga merupakan ukuran Uji.
Pendekatan standar digunakan untuk menunjuk atau memilih tipe kesalahan, misalkan
memilih antara atau , yang akan digunakan sebagai nilai kepercayaan dari
Uji, kemudian nilai ini digunakan untuk menentukan daerah kritis. Diantara semua daerah
kritis akan dipilih satu yang paling kecil [ ].
Secara umum, diharapkan melakukan Uji terhadap dengan (dimana
) pada tingkat kepercayaan dengan [ ] . Uji berdasarkan pada statistic uji
̅
⁄√
(12.1.1)
Ekuivalen dengan menggunakan ̅ , jadi dapat ditunjukkan dengan tepat uji untuk menolak
jika , dimana merupakan nilai perhitungan dari , dengan batasan ,
[ ] , dan mempunyai daerah kritis sebesar . Peluang dari kesalahan tipe II
untuk alternative adalah
̅
[ ] [ | ]
⁄√
̅
[ ⁄√ ⁄√
| ]
sehingga
[ ] ( ) (12.1.2)
⁄√
Sampel berukuran yang akan memberikan nilai [ ] adalah penyelesaian untuk
⁄√
(12.1.3)
Diberikan
⁄√
⁄√
⁄√
⁄√ ⁄√
⁄√ ⁄√ ( )
⁄√ ( ) ( )
( )
√
( )
( )
( )
(12.1.4)
Pada contoh 12.1.1 untuk
( ) ( )
Di peroleh
Definisi 12.1.4
Fungsi kuasa, ( ), dari Uji adalah peluang penolakan ketika nilai sebenarnya dari
parameter adalah .
122
Untuk hipotesis sederhana dengan , mempunyai nilai ( )
[ ] dan ( ) [ ] . Untuk hipotesis komposit, katakan
dengan , ukuran dari Uji (atau daerah kritis) adalah
( ) (12.1.5)
Jika nilai sebenarnya berada di , maka ( ) [ ], sehingga [ ]
bergantung pada . Dengan kata lain, nilai fungsi kuasa selalu berada di bawah area pdf uji
statistik dan di luar daerah kritis. Diberikan nilai [ ] untuk pada hypothesis nol dan nilai
[ ] untuk pada hypothesis alternatif.
Gambar 12.2. Hubungan fungsi kuasa dengan peluang kesalahan tipe II.
( ) ( ) (12.2.2)
⁄
√
Untuk , ada ( ) ( ) [ ]. Andaikan
dilakukan uji . Akan menolak jika pertidaksamaan
(12.2.1) dipenuhi. Berikut merupakan uji untuk hipotesis nol komposit. Peluang
menolak untuk adalah ( ) ( ) ( ) , dengan
123
demikian ( ) . Jadi, jika daerah kritis dipilih untuk nilai pada , maka
kesalahan Type I akan kurang dari α untuk semua . Jadi, uji α yang sering
dikembangkan untuk hipotesis nol sederhana dapat digunakan untuk hipotesis komposit dan
P[TI] tidak akan kurang dari α. Bentuk umum dari fungsi kuasa ditunjukkan pada gambar
12.3 untuk n = 20 dan 100.
Gambar 12.3 uji perbandingan fungsi kuasa saat dua ukuran sampel berbeda.
Dari gambar 12.3, lebih jelas mengapa kegagalan menolak seharusnya tidak
ditafsirkan sebagai penerimaan . Pada kenyataannya, dapat ditemukan suatu nilai
alternatif µ kecukupan untuk , sehingga uji kuasanya, π(µ), tidak berubah-ubah untuk α.
Pada khususnya ini tidak akan menjadi menjadi masalah yang serius jika dapat menentukan
daerah yang diabaikan, yang mana merupakan subset alternatif untuk uji kuasa kecil. Dengan
kata lain, tidak terlalu penting mendapatkan nilai µ yang cocok untuk . Pada contoh, tidak
terlalu diperhatikan tentang penolakan saat µ berada pada interval yang kecil, misalkan
( ), dapat diambil sebagai daerah yang diabaikan. Saat µ ≥ , ukuran sample dapat
ditentukan dari persamaan (12.1.4) yang akan memberikan nilai kuasa ( ) . Jadi,
untuk nilai alternatif yang berada di luar daerah yang diabaikan, suatu uji dapat dibangun
hingga mencapai atau melebihi perbandingan kesalahan yang sudah ditentukan untuk kedua
tipe kesalahan.
NILAI-P
Tidak ada perjanjian tentang bagaimana α yang kecil digunakan untuk menolak
sebagai bukti yang kuat dalam mendukung . Percobaan 1 akan mempertimbangkan α =
0.05, sementara percobaan 2 menggunakan α = 0.01. Jadi, ada kemungkinan untuk menolak
percobaan 1 saat percobaan 2 diterima. Uji nilai-p, didefinisikan sebagai ukuran α terkecil
yang dapat menolak , berdasarkan nilai yang diamati dari uji statistik.
Contoh 12.2.1
Berdasarkan pada ukuran sample dari distribusi normal, ( ), ingin uji
dengan . diketahui ̅ . Nilai-p adalah [ ̅ |
] ( ) . Karena , Uji akan
ditolak saat 0.05 dan diterima saat 0.01.
124
Untuk uji , akan menolak jika
(12.2.3)
Jadi, daerah kritis dari α sekarang diambil dari arah kiri distribusi uji stastistik. Uji hipotesis
tersebut adalah uji satu arah. Uji dengan daerah kritis dari bentuk (12.2.1) disebut uji satu
arah batas atas dan bentuk (12.2.3) disebut uji satu arah batas bawah.
Tipe lainnya adalah uji alternatif dua arah. Akan uji dengan alternatif
. Jika memilih arah kanan dari daerah kritis, maka akan mempunyai kuasa bagus untuk
menolak saat , tapi kuasanya akan lemah saat . Sama halnya jika dipilih
arah kiri dari daerah kritis, maka kuasanya akan bagus jika , tapi kuasanya akan
lemah jika . cara yang baik adalah menggunkan uji dua arah dari daerah kritis dan
menolak jika
⁄ ⁄ (12.2.4)
Dalam kasus ini masuk akal untuk menggunakan uji equal-tailed (masing-
masing arah berukuran ⁄ ) karena pertimbangan simetri. Fungsi kuasa untuk uji dua-arah
adalah
( ) [ ⁄ ⁄ | ]
Diberikan
( ) ( ⁄ ) ( ⁄ ) (12.2.5)
⁄√ ⁄√
Jika , maka seperti pada gambar 12.4 , peluang normal fungsi kuasa di atas akan
mendekati nol. Sama halnya, jika , maka satu yang tidak akan diharapkan untuk
menolak dengan mendapatkan ̅ besar, dan peluang normal akan mendekati nol. Rumus
ukuran sample untuk uji dua arah diberikan oleh persamaan (12.1.4) dengan
⁄ .
125
Jadi, nilai berada dalam “ daerah penerimaan ” ( daerah yang tidak ditolak)
dengan selang kepercayaan (1-α) 100% untuk .
126
3. Dengan tingkat kepercayaan untuk menguji dengan , menolak
jika atau .
Untuk nomer 1 dari teorema, , fungsi kuasanya adalah
̅
( ) = [ ( )| ] ;v=(n-1)
⁄√
̅ ( )
= [ ( )| ]
⁄√
sehingga
( ) = [ ( )], (12.3.7)
√ ⁄
127
Bukti
Mendapatkan fungsi kuasa untuk kemungkinan nomor 1
( ) = [ ( )| ]
= [( ) ⁄ ( ⁄ ) ( )| ]
= [( ⁄ ) ( ) ]
( ) [ ( ) ] ( ) , karena ( ) bertambah, ukuran
daerah kritis adalah .
Sebagai latihan, sangat tepat menggunakan uji dua arah untuk mendapatkan fungsi kuasa
bagian 3, tapi untuk nilai dan yang berbeda, dengan .
Terdapat kemungkinan mendapatkan ukuran sampel untuk uji ini. Sebagai contoh, untuk uji
bagian 1, ingin didapat ( ) untuk . Hal ini membutuhkan nilai
sehingga
( ⁄ ) ( ) ( ) (12.3.12)
Persamaan ini tidak dapat diselesaikan secara eksplisit untuk , tetapi aturan iterasi
berdasarkan percentile pada Tabel 4 (Lampiran C) dapat digunakan untuk mencari nilai
khusus , , dan ⁄ . Hal ini juga diinginkan untuk mendapat rumus pendekatan yang
memberikan secara eksplisit sebagai fungsi dari nilai . Seperti pendekatan yang
berdasarkan pada pendekatan normal ( ) √ , dimana telah diberikan di bab 8.
Jika pendekatan jumlah sampel ini digunakan uji dua arah dari persamaan (12.3.12), maka hal
ini mungkin untuk mendapat pendekatan
( ⁄ )
[ ( ⁄ )
] (12.3.13)
Contoh 12.3.2
Ingin uji dengan , untuk dan kuasa
adalah benar. Berdasarkan pendekatan (12.3.13) dengan ,
, dan ( ⁄ ) didapat . Jika dihitung kedua arah persamaan
(12.3.12) untuk nilai , didapat keputusan baik saat , dimana sesuai
dengan .
Uji Dua Sampel
Kemungkinkan untuk uji hipotesis variansi dari dua distribusi normal, andaikan ⁄
, digunakan uji statistik F sebagai berikut:
(12.3.14)
dimana ( ) jika benar.
Teorema 12.3.4
Andaikan dan adalah nilai teramati sampel acak saling bebas dari
( ) dan ( ), berturut-turut, dan diberikan uji statistikya sebaga berikut:
(12.3.15)
Ada 3 kemungkinan menolak H0, yakni:
128
1. Dengan tingkat kepercayaan untuk menguji ⁄ dengan ⁄ ,
menolak jika ⁄ ( ).
2. Dengan tingkat kepercayaan untuk menguji ⁄ dengan ⁄ ,
menolak jika ⁄ ( ).
3. Dengan tingkat kepercayaan untuk menguji ⁄ dengan ⁄ ,
menolak jika ⁄ ( ) atau menolak jika ⁄ (
).
Jika variansi tidak diketahui tapi bernilai sama, maka uji hipotesis rata-rata
dapat dicari menggunakan distribusi t. Diberikan oleh
̅ ̅
(12.3.16)
√
Teorema 12.3.5
Andaikan dan adalah nilai sampel acak saling bebas dari dua populasi
yang berdistribusi normal, masing-masing ( ) dan ( ), dimana .
Berikut ini ada 3 kemungkinan untuk menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji dengan
, menolak jika ( ).
2. Dengan tingkat kepercayaan untuk menguji dengan
, menolak jika ( ).
3. Dengan tingkat kepercayaan untuk menguji dengan
, menolak jika ( ). atau ( ).
Fungsi kuasa untuk uji ini menggunakan distribusi noncentral t. Hal ini mungkin untuk
menentukan sampel yang besarnya sama untuk uji satu arah dengan kuasa
menggunakan Tabel 8 (Lampiran C) dengan | | . Untuk uji dua arah,
besarnya adalah .
variansi yang berbeda, pendekatan uji dapat dilakukan berdasarkan pendekatan statistik t
Welch yang diberikan oleh persamaan (11.5.13).
129
dan variansi . Diberikan ̅ dan adalah rata-rata sampel dan variansi
sampel dari selisih , untuk , dan diberikan
̅
(12.3.17)
√
Berikut ini ada 3 kemuninan untuk menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji dengan
, menolak jika ( ).
2. Dengan tingkat kepercayaan untuk menguji dengan
, menolak jika ( ).
3. Dengan tingkat kepercayaan untuk menguji dengan
, menolak jika ( ). atau ( ).
√ ( )
2. Dengan tingkat kepercayaan untuk menguji , menolak
jika
3. Dengan tingkat kepercayaan untuk menguji , menolak
jika ⁄ ⁄
Ketika , didapat
( )
√ ( )
Seperti pada contoh uji satu arah, kemungkinan untuk menolak akan kurang dari α untuk
nilai p yang lain pada hipotesisnol.
Teorema 12.4.2
Andaikan ( ) ( ) merupakan CDF binomial. Nilai S yang diamati
ditunjukkan oleh s .
Ada 3 kemungkinan menolak H0, yakni:
1. Dengan tingkat kepercayaan yang konservatif untuk menguji
, menolak jika
( )
2. Dengan tingkat kepercayaan yang konservatif untuk menguji
, menolak jika
( )
130
3. Uji dua sisi yang konservatif untuk menguji , menolak
jika
( ) ⁄ ( ) ⁄
Konsep dari uji hipotesisdapat dijelaskan dengan model berikut. Jika kasus pertama adalah
uji ditolak jika s yang diamati kecil dan tidak mungkin (≤α) saat
. jadi daerah kritis mempunyai ukuran ≤ α.
Pada kasus 2 jika menjadi nilai yg diuji maka ( ) , ujinya akan mempunyai
tingkat kepercayaan α; sebaliknya, disebut konservatif.
Untuk uji hipotesisdari dua populasi,andaikan X ( ) ( ), X dan Y
independen. MLEnya adalah ̂ ⁄ ̂ ⁄ . ,
̂ ( )⁄( ). Jika maka
̂ ̂
( )
√ ̂( ̂) ( )
Dengan tingkat kepercayaan α untuk menguji dengan akan
menolak ⁄ ⁄ .
131
Definisi 12.6.1
Uji dari dengan yang didasarkan pada daerah kritis C* dikatakan
sebagai uji kuasa dengan tingkat kepercayaan α jika
1. ( ) , dan
2. ( ) ( ) untuk sembarang daerah kritis C dari ukuran α [ ( ) ]
( )
( )
( )
dan
C* = {( )| ( ) }
dimana k adalah konstanta, sehingga
[( ) | ]
Maka C* adalah uji kuasa dengan tingkat kepercayaan α untuk menguji dengan
BUKTI :
Untuk membuktikan, ambil notasi vektor, ( ) dan ( ). Jika A
adalah sebuah kejadian dimensi ke-n, diberikan
[ | ] ∫ ( ) ∫ ∫ ( )
Untuk kasus kontinu. Untuk diskrit caranya sama, dengan mengganti integral. Akan
digabungkan komplemen dari himpunan C oleh ̅ . Dengan catatan bahwa jika A adalah
subset dari C*, maka
[ | ] [ | ]
karena ∫ ( ) ∫ ( ). Begitu juga, jika A adalah sebuah subset dari ̅ , maka
[ | ] [ | ]
Perhatikan bahwa dari sembarang daerah kritis C didapatkan
( ) ( ̅ )dan ( ) ( ̅ )
Selanjutnya,
( ) [ | ] [ ̅| ]
dan
( ) [ | ] [ ̅ | ]
Dan selisihnya adalah
( ) ( ) [ ̅| ] [ ̅ | ]
132
Kombinasi persamaan
( ) ( ) [ ̅| ] [ ̅ | ]
Dengan dan
[ | ] [ | ]
dan
[ | ] [ | ]
didapat
( ) ( ) [ ̅| ] [ ̅ | ]
sehingga
( ) ( ) ( ){ [ ̅| ] [ ̅ | ]}
( ) ( ) ( )[ ( ) ( )]
Jika C adalah daerah kritis dari α, maka ( ) ( ) , maka sisi kanan
dari pertidaksamaan adalah 0, selanjutnya ( ) ( )
Filsafat umum dari Neyman-Pearson untuk uji hipotesis adalah mengambil nilai sampel ke
dalam daerah kritis. Faktanya, lemma Neyman-Pearson menyatakan bahwa kriteria untuk
memilih nilai sampel berdasarkan pada besarnya rasio dari fungsi likelihood dari dan .
Contoh 12.6.1
Diketahui sample acak berukuran n dari distribusi eksponensial ( ). Akan menguji
dengan dimana .
Lemma Neyman-Pearson menyatakan menolak jika
( ∑ )
( )
( ∑ )
dimana k adalah [ ( ) ] , batas bawah .Sehingga
[ ( ) | ] [∑ ( ) (( ) )| ]
jadi,
[ | ] [∑ | ]
dimana (( ) )/( ). Perhatikan bahwa pada pertidaksamaan berubah
karena ( ) pada kasus ini. Sehingga, uji kuasa daerah kritis mempunyai bentuk C*
= {( )|∑ }. Perhatikan bahwa batas bawah ,dipunyai ∑
( ), jadi bahwa ( ) akan memberi daerah kritis pada tingkat
kepercayaan α, dan uji ekuivalen akan menolak jika ∑ ( ).
Sama halnya, jika ingin menguji dengan dengan , maka uji
kuasa dengan tingkat kepercayaan , jika ∑ ( ). Perbedaan antara
dua uji ini adalah tanda dari ( ) pada dua kasus yang berbeda. Dengan kata lain, pada
133
sisi kanan sebuah persamaan [ | ] [∑ | ] menjadi [∑ | ] jika
, yang mana korespondensi untuk ( ) . Catatan bahwa cara ini berlaku
untuk C* bergantung pada hipotesisalternatif. Begitu juga, uji kuasa dari
dengan adalah sama.
Contoh 12.6.2
Diketahui sampel acak berukuran n dari distribusi normal dengan rata-rata nol, ( ).
Akan diuji dengan dengan . Pada kasus ini,
( ) [ ]
√
( )
( ) [ ]
√
Selanjutnya, ekuivalensi terhadap
( )
Contoh 12.6.3
Dapatkan uji kuasa dari dengan berdasarkan pada statistik
( ). Didapatkan :
( ) ( )
( ) ( )
sehingga
( )
{ }
( )
atau
( )
[ ]
( )
( )
Karena , saat log negatif dan uji jika . Sekarang
( )
[ | ] ( )
jadi, untuk nilai integral i = 1, …., n, uji kuasa dari tingkat kepercayaan , menolak jika
. Untuk menentukan tingkat kepercayaan , uji akan memilih konservasi seperti
pembahasan di awal.
Contoh12.6.4
Diberikan sample acak berukuran n, akan diuji ( ) dengan ( ).
Didapatkan :
134
( )
( )
Jadi, ditolak jika . Dari teorema limit dapat digunakan untuk
mendapatkan pendekatan nilai kritis. Diketahui jika ( ),maka ( )
( ) , dan
̅
( )
√
Demikian, pendekatan tingkat kepercayaan pada uji akan menolak jika
√ ( ̅ )
Konsep uji kuasa akan diperluas pada kasus hipotesiskomposit.
Contoh 12.7.1
Diberikan sampel acak dengan ukuran n dari distribusi eksponensial, ~ EXP (θ).
Seperti pada contoh 12.6.1 bahwa uji kuasa dengan tingkat kepercayaan α H0 : θ = θ0 dengan
: θ = θ1 ketika θ0 >θ1 untuk menolak H0 jika 2n ̅ / θ0 = 2 ∑ / θ1 ≥ (2n). karena tidak
bergantung pada nilai particular dari θ1 , tetapi kenyataanya bahwa θ1> θ0 itu menunjukkan
bahwa uji UMP dari H0 : = θ0 dengan Hα : θ > θ0.
Catatan juga bahwa fungsi kuasa untuk uji ini bisa di ekspresikan dengan syarat CDF chi
– square, H(c;v) dengan v = 2n.
(θ) = 1 – H [(θ0 / θ) (2n) ; 2n]
bernilai (θ0 / θ)[2∑ / θ0] = 2 ∑ / θ0 ~ X2 (2n) ketika θ bernilai benar . karena (θ) adalah
fungsi naik dari θ, max (θ) = ( 0) = disebut uji UMP dengan tingkat kepercayaan α
untuk hipotesis komposit H0: ≤ 0 dengan Hα: > 0
135
Sama halnya dengan uji UMP dari: = 0 dengan Hα: < 0, menolak H0 jika 2n ̅ / θ0 ≤
(2n). dan fungsi kuasanya adalah
(θ) = H [(θ0 / θ) (2n) ; 2n]
Definisi 12.7.2
Pdf bersama f(x; ) dikatakan mempunyai monoton likelihood ratio (MLR) pada statistik
T=t(X) jika terdapat dua atau lebih nilai dari parameter ,rasio nya ( )
( ) bergantung pada x melalui fungsi t(x), dan rasio ini bukan penurunan fungsi dari
t(x).
Contoh 12.7.2
Diberikan sample acak ukuran n dari distribusi eksponensial, Xi EXP( ).
( )=(1/ )n exp (-∑ ) dan
( )
( ⁄ ) [ ( )∑ ]
( )
Dimana sample acak ini tidak bergantung pada fungsi t(x)=∑ jika Sehingga f(x; )
mempunyai penyelesaian MLR dalam statistik T=∑ MLR juga berlaku pada statistik ̅ ,
karena merupakan peningkatan fungsi dari T. MLR bisa digunakan dalam pengujian UMP.
Teorema 12.7.1
Jika pdf bersama f(x; ) mempunyai rasio monoton likehood T = t(X), maka uji UMP dengan
ukuran α untuk H0 : θ ≤ θ dengan Hα : > 0 , menolak H0 jika t(X) ≥ k dimana P[t(X)≥k ׀0]
=α
Untuk menguji H0 : ≥ 0 dengan : < 0 juga bisa diselesaikan dengan pendekatan MLR
tetapi tidak sesuai dengan teorema 12.7.1.
Contoh 12.7.3
Di berikan sampel acak dengan ukuran n dari dua parameter distribusi eksponensial
~ ( ). Pdf bersama :
[ ∑( )]
( ){
Teorema 12.7.2
Diberikan ,…, mempunyai pdf bersama :
F(x;θ) = c (θ)h(x)exp[q(θ)t(x)]
Dimana q(θ) adalah fungsi naik dari θ
136
Ada 2 kemungkinan menolak H0, yakni:
1. Suatu uji UMP dengan tingkat kepercayaan α untuk menguji H0 : θ ≤ 0 dengan :
> 0 , menolak H0 jika t(x)≥k, dimana P[t(X) ≥ k | 0] = α
2. Suatu uji UMP dengan tingkat kepercayaan α untuk menguji H0 : ≥ 0 dengan :
< 0 , menolak H0 jika t(x) ≤ k, dimana P[t(X) ≤ k| 0] = α
Bukti :
Jika 1< 2, maka q( 1) < ( 2) sehingga
( ) ( )
{[ ( ) ( ) ( )]}
( ) ( )
Fungsi diatas merupakan fungsi naik dari t(x) karena ( ) ( )>0.Teorema ini
mengikuti kriteria MLR.
Contoh 12.7.4
Diberikan sampel acak dengan ukuran n dari distribusi poisson ~ ( )..pdf bersama
∑
( )= untuk semua
= ( ) exp [(ln )∑ ]
diketahui q( ) = ln ( ) dan t(µ) = ∑ . Uji UMP dengan tingkat kepercayaan α untuk H0 : ≥
0 dengan : < 0 akan menolak H0 jika T = ∑ ≥ k dimana P[T≥ k]= α.
Karena T ~ POI (n ) , harus mendapatkan
∑ ( )(( )t/t! = α
Terdapat masalah diskrit, tetapi uji yang di jelaskan pada theorem 12.7.2 ini merupakan uji
UMP untuk nilai-nilai tertentu yang dapat dicapai.
UJI UNBIASED
Disebutkan sebelumnya bahwa dalam beberapa kasus pengujian UMP mungkin tidak ada,
khususnya untuk alternatif dua sisi, mungkin ada pengujian UMP antara kelas terbatas yaitu
pengujian "unbiased"
DEFINISI 12.7.3
Pengujian dari Ho : θ Ωo dengan : Ω - Ωo adalah unbiased jika
( ) ( )
DEFINISI 12.7.3
Pengujian dari Ho : θ Ωo sedangkan Hα : Ω - Ωo adalah unbiased jika
min π(θ)≥ max π(θ)
ɵ€ Ω-Ωo ɵ€ Ωo
Dengan kata lain kemungkinan Ho ditolak bernilai salah ketika minimum dan kemungkinan
Ho ditolak bernilai benar ketika maksimum.
137
Contoh 12.7.5
sampel acak dengan ukuran n dari distribusi normal dengan mean nol, ~ ( ).
Diinginkan untuk menguji Ho= = dengan, : berdasarkan statistic uji =
∑ . Ho diketahui bahwa ~ (n).jadi untuk uji dua arah daerah kritis sama dengan
bagian 3 dari theorem 12.3.3, akan menolak Ho jika ≤ (n). dengan kata lain, sampel
dengan ukuran n = 2 dan tingkat kepercayan = 0.05 untuk Ho: = 1. Grafik fungsi kuasa
untuk uji ini diberikan dalam gambar 12.5
138
( ̂ )
( )
( ̂)
Dimana ̂ menunjukkan MLE biasa dari , dan ̂ menunjukkan MLE dengan batasan bahwa
H0 benar.
Menurut definisi di atas, dapat dikatakan bahwa ̂ dan ̂ didapatkan dari memaksimalkan
f(x;) terhadap dan 0. Uji GLR ini digunakan untuk menolak H0 jika ( ) k, dimana k
dipilih untuk melengkapi tingkat kepercayaan .
Contoh 12.8.1
Misalkan Xi N(, 2), dimana 2 diketahui, akan dilakukan uji untuk hipotesis:
H0 : 0
: 0
MLE biasa (tanpa batasan) adalah
̂ ̅ , dan GLRnya adalah:
( ̂ )
( )
( ̂)
( ) [ ( ) ]
=
( ) [ ( ̅) ]
[ ( ) ]
=
[ ( ̅) ]
= [ (̅ ) ]
Contoh 12.8.2
Akan dilakukan pengujian hipotesis H0 : 0 dengan : 0.
Uji GLR pada contoh ini didapatkan dari penurunan uji UMP satu arah yang didasarkan pada
nilai z. Diberikan MLE dengan =[0,)
̅ ̅
̂ {
̅
Karena tingkat kepercayaan pada uji ini cukup kecil untuk menolak H0 dengan nilai ̅ yang
besar, ditentukan daerah kritis dari statistik GLR untuk ̅
[ ( ̅ ) ] ̅
( ) {
̅
Dengan batasan H0, diperoleh P[λ(X)<1] = P[ ̅ ]=0,5 atau < 0.5, k < 1, dan daerah
kritisnya tidak akan memuat x sehingga λ(x)=1.
139
Dengan kata lain, uji GLR menolak H0 jika ̅ dan λ(x) k yang ekuivalen dengan
Z² =[√ ( ̅ ) ] untuk ̅ ;
z² ≥ k1 jika dan hanya jika z ≥ √ . Tingkat kepercayaan (untuk < 0.5) menolak H0 jika
yang juga merupakan uji UMP untuk hipotesis ini.
Uji GLR dari H0 : 0 dan : 0 dengan ̂ ̅ , pemaksimalan fungsi likelihood
dengan 0 diberikan oleh
̅ ̅
̂ {
̅
Sehingga
̅
( ) {
[ ( ̅ ) ] ̅
Dapat disimpulkan bahwa keduanya memiliki penyelesaian yang sama untuk pengujian
sederhana terhadap H0 : 0 dan : 0. Daerah kritis yang sama juga memberikan
tingkat kepercayaan untuk hipotesis null komposit H0 : 0 karena ( ̅ )⁄( ⁄√ ),
P[Z ≥ z1- | 0] = , dan P[Z ≥ z1- | ] < untuk <0.
Terkadang diinginkan untuk melakukan pengujian terhadap hipotesis dengan satu parameter
yang tidak diketahui karena adanya parameter bermasalah yang tidak diketahui.
Contoh 12.8.3
Misalkan Xi N(, 2), dimana 2 diketahui, akan dilakukan uji untuk hipotesis H0 : 0
dengan : 0. Hal ini tidak menunjukkan hipotesa null sederhana karena distribusi ini
tidak ditetapkan sepenuhnya dibawah H0. Populasi yang digunakan dua dimensi,
( ) ( ) {( )| } D] dan H0 : 0
merupakan penyingkatan notasi dari H0 : (,²) 0 dimana
{ } ( ) {( )| }.
Himpunan di atas digambarkan pada gambar di bawah ini:
140
( ̅)
Pemaksimalan f(x; ,²) di daerah , MLEnya ̂ ̅ dan ̂ ∑ , tetapi pada daerah
( )
0 didapatkan ̂ dan ∑ sehingga,
(
̂̂ )
( )
(
̂̂ )
( ) [ ( ) ]
=
[ ( ̅) ]
( )
( ) [ ( ) ( ) ]
=
( ) [ ( ̅) ( ̅) ]
=( )
maka dari itu
( )
( ) ( ̅)
( ̅) ( )
( ̅)
( )
( ̅)
( ) √ (̂ ) √ ( ̅ )
= 1 +( dengan ( ) =
) √ ( ̅) ( )
Dengan batasan H0 : 0, T= ( ) – t(n – 1) dan T² F(1, n – 1) menolak H0 saat λ(x)
bernilai kecil atau dengan nilai T² besar dan tingkat kepercayaan akan menolak jika
t -t1- /2 (n-1) atau t t1- /2 (n-1)
dengan menggunakan uji dua arah berdasarkan pada student’s t.
Pendekatan GLR juga bisa digunakan untuk dua sampel
Contoh 12.8.4
Misalkan X N(n1, p1) dan Y N(n2,p2) dengan X dan Y independen, akan diuji H0:p1p2=p
dengan : p1p2 , dimana p tidak diketahui.
Populasinya =(0,1)×(0,1)={(p1,p2)|0<p1<1 dan 0<p2<1}dan subset koresponding untuk H0
adalah 0={(p1,p2) ={(p1,p2)|0<p1 = p2<1}
141
( )̂ ( ̂ ) ( )̂ ( ̂ )
=
( )̂ ( ̂ ) ( )̂ ( ̂ )
Kecuali untuk koefisien binomial, statistik GLR ini tidak akan digunakan pada saat
pengerjaan soal yang sederhana, namun bisa didapatkan dengan perhitungan yang sederhana.
Distribusi ( ) digunakan untuk p di bawah H0, sehingga tingkat kepercayaan dan daerah
kritis yang tepat tidak bisa ditentukan. Distribusi chi-square pada kasus ini sangat berguna
untuk ukuran sampel yang besar. Hipotesis H0 menunjukkan pembatasan satu dimensi pada
ruang populasi karena hal itu menunjukkan H0:θ=p2-p1 = 0 ; jadi r=1 seperti pada contoh
12.8.2 dan pendekatan untuk tingkat kepercayaan :
( ) ( )
dan H0 ditolak jika ( ) ( )
UJI SAMPEL-k
Pendekatan GLR sangat membantu dalam penurunan uji yang melibatkan sampel-sampel
dari dua atau lebih distribusi normal. Sampel acak independen bisa didapatkan dari k
distribusi normal. Untuk setiap j=1,…k, akan ditunjukkan arti dari sampel individu j dan
variansi sampel dengan
=( ) exp [ ∑ ∑( )
Ln L = - ln (2 )- ∑ ∑( )
Teorema 12.8.1:
Untuk k populasi normal dengan variansi N( ), j = 1,…,k, uji tingkat kepercayaan
untuk Ho, dimana
: =...= , ditolak jika:
( ̂ ̂) ( )
( )
∑ ( )
Dimana dan ∑ . Uji ini ekuivalen (memiliki kesamaan) dengan uji
GLR
Teorema 12.8.2:
Misalkan
M=M( ) [ ∑ ]- ∑
142
Dan diketahui
c = 1+ [∑ ]
( )
Teorema 12.8.3:
Untuk k populasi normal dengan ( ), dengan j = 1,……,k, kemungkinan nilai α dari
uji akan menolak H0 jika:
( ) ( )
Misalkan S= sehingga ( )
( )
( | )( )
( )
( )
( )
( )( ) ( )
( ) ( )
( )( )
( )
Y= 0,…,s dan s= 0,…,
Sehingga distribusi berubah menjadi distribusi hypergeometri. Komudian nilai untuk
menolak jika y ( ) atau untuk tingkat kepercayaan ,menolak jika
143
( )( )
∑
( )
Teorema 12.9.1
Diberikan X=( ), memiliki pdf bersama:
( ) ( ) ( ) [ ( ) ∑ ( )]
Contoh 12.10.1
Gaya (dalam pounds) dapat menyebabkan beberapa tipe bagian keramik mobil menjadi
rusak dengan mean dan standard deviasi =40. Bagian yang asli diketahui memiliki
ketahanan dari rusak dengan tekanan sebesar 100 pounds. Pabrik mengklaim bahwa suku
cadang lebih baik dari pada yang asli karena dapat menahan tekanan hingga 120 pounds.
Untuk mendemonstrasikan klaim tersebut, suatu uji dilakukan dimana ketahanan diukur pada
suatu sample sebanyak n dari suku cadang dengan variabel x1, … , xn. berdasarkan pada hasil
data, pabrik suku cadang memilih untuk menggunakan ukuran =0.05 untuk menguji
hipotesis H0 : 100 dan Ha : >100.
Berdasarkan pada teorema 12.7.1 bahwa uji UMP dari nilai untuk H0 : 0 dan : >0
akan menolak H0 jika ̅ untuk nilai c yang tepat. Selain itu, menurut teorema 12.3.1 yang
144
ekuivalen yakni menolak H0 jika z0=√ ( ̅ ) dan pada contoh ini diketahui
bahwa =P[kesalahan tipe II] maka nilai n diberikan dengan n=( )²²/(0-1)².
Jadi, untuk memiliki ukuran =0.05 uji terhadap suku cadang dengan =0.10 pada saat
=120, banyaknya sample yang dibutuhkan adalah
n=(1.645+1.282)²(40)²/(100-120)² = 34.
Secara tidak langsung, biaya dari proyek ini bergantung pada banyaknya suku cadang
yang diuji, dimana kemungkinan kepercayaan untuk mencari prosedur yang tepat diperlukan
pengujian pada beberapa bagian suku cadang yang diuji. Kemungkinan tersebut dengan
mempertimbangkan uji sekuensial. Dengan kata lain, ada kemungkinan untuk menemukan
suatu prosedur, seperti menguji beberapa suku cadang awal, yang dapat menghasilkan cukup
bukti untuk menolak ataupun menerima H0 tanpa menggunakan uji lainnya.
[( | )] ∑∫ ( )
Dan
[( | )] ∑∫ ( )
∫ ( ) ∫ ∫ ( ) ( )
145
Dan
∫ ( ) ∫ ∫ ( ) ( )
Dimana dan merupakan pendekatan dari k0 dan k1. Berdasarkan pada N< dengan
peluang 1 dan λn( ) k0 untuk ( ) ada didalam Cn, sehingga
[( | )] ∑∫ ( ) ∑∫ ( )
∑∫ ( )
[( | )]
( )
Dengan /(1-) k0 , karena λn( )≥k1 untuk ( ) ada didalam An, sehingga
[( | )] ∑∫ ( ) ∑∫ ( )
[( | )]
( )
Kemudian akan didefinisikan dan yang merupakan nilai kesalahan yang timbul akibat
dari penggunaan nilai dan .
∑∫ ( ) ∑∫ ( ) ( )
∑∫ ( ) ∑∫ ( ) ( )
146
Contoh 12.10.2
Berdasarkan pada contoh 12.10.1. Diketahui mean dan standard deviasi =40. Akan
dilakukan uji untuk menguji hipotesis null sederhana hipotesis H0 : =100 dan hipotesis
alternatif : =120 dengan =0.05 dan =0.10.
Sehingga pendekatan nilai kritis untuk SPRT adalah nilai 0.05/(1-0.10)=0.056 dan
= (1-0.05)/0.10=9.5. dengan kata lain, uji tersebut dapat menolak H0 pada λn 0.056 dan
menerima H0 pada λn ≥ 9.5 atau dapat digunakan uji berdasarkan jumlah data dengan pdf
bersama: ( ) [ ( ) ], didapatkan:
√
( ) ( )
( ) ( )
[ ( ) ( )]
[ ( )]
∑ [ ∑ ( ) ]
(( )| ) [ ( )]
( )( )
Sehingga untuk penyelesaiannya, didapatkan (( )| ) untuk dan
berdasarkan pada keterangan diatas dengan 0=100 dan 1=120, maka
[ ] ( ) [ ]
( | )
( ) [ ( ) ]
( ) [ ] [ ]
( | )
( ) [ ( ) ]
Untuk SPRT, banyaknya sample yang diharapkan secara berurutan adalah 16 dan 19 dengan
syarat H0 dan , dibandingkan dengan jumlah sample n=34 menurut pertimbangan uji
Neyman-Pearson untuk contoh 12.10.1.
147
RINGKASAN
Pada Bab ini dijelaskan mengenai uji hipotesa dimana ditujukan untuk menguji benar
atau salahnya hipotesa statistik dari suaru percobaan. Jika ( ), hipotesa statistik
adalah pernyataan tentang distribusi . Jika hipotesa tersebut ditetapkan dengan lengkap
( ), maka disebut sebagai hipotesa sederhana, dengan kata lain disebut komposit.
Kesalahan dalam menolak maupun menerima H0 di bedakan menjadi dua, yakni: Kesalahan
tipe I yaitu kesalahan yang terjadi pada saat menolak kebenaran , sedangkan Kesalahan
tipe II adalah kesalahan yang terjadi pada saat menerima padahal salah.
Jika suatu uji ditulis dalam bentuk himpunan data dengan memiliki ukuran sebanyak n
dan daerah kritis (daerah penolakan) merupakan subset dari n-dimensi ruang Euclidean, maka
H0 ditolak pada saat n-dimensi data vector berada di dalam daerah kritis.
Fungsi kuasa memberikan peluang menolak H0 (hipotesa null) yang salah untuk (hipotesa
alternatif) dengan nilai yang berbeda. Misalkan pada lemma Neyman-Pearson, pada uji ini
terdapatkemungkinan untuk mendapatkan uji kuasa terbesar untuk penentuan ukuran sampel,
namun ada beberapa kasus yang harus menggunakan uji UMP untuk menyelesaikannya.
Uji UMP tak selalu dapat memperoleh hasil, oleh karena itu uji GLR digunakan untuk
mendapatkan hasil yang tepat. Contohnya, pendekatan bisa dilakukan pada beberapa kasus
untuk mendapatkan uji hipotesis dengan parameter yang bermasalah dan juga keadaan
dengan penyelesaian dua-arah. Pada suatu permasalahan, ada kemungkinan untuk
mendapatkan uji UMP unbias (UMPU) yang juga dapat digunakan untuk mendapatkan
parameter yang bermasalah dan juga hipotesa alternatif dengan penyelesaian dua arah.
SOAL-SOAL LATIHAN
1 Andaikan Xo , X1 , ... , X16 sampel acak berukuran n=16 dari distribusi normal XiN(,1).
Akan diuji Ho : = 20 dengan tingkat kepercayaan α = 0,05 berdasarkan rata-rata sampel
̂,
a. Tentukan daerah kritis pada A: {̅| -∞ < ̅ ≤ } dan B {̅| b ≤ ̅ < ∞}
b. Cari peluang dari kesalahan tipe II, =P[TII], untuk setiap daerah kritis pada soal (a)
untuk
Penyelesaian:
a. Tentukan daerah kritis A: {̅| -∞ < ̅ ≤ } dan B {̅| b ≤ ̅ < ∞}
̅ µ µ
P[ ≤ ] =P[ ]
√ √ √
=P[ ( )]
Sehingga,
( ) = –1.65
( ) = –0.4125
148
= 20 – 0.4125
= 19.5875
α = P [b ≤ ̅ < ∞] , P[̅ ≥ b]
0.05 = P [b ≤ ̅ < ∞]
̅ µ µ
0.05 = P [( )≤ ]
√ √
0.05 = P [z ≤ ]
√
0.05 = P[ ( )]
0.05 =1–P[ ( )]
4 (b–20) = 1.65
b–20 = 0.4125
b = 20 + 0.4125
= 20.4125
= P [z < -2.35]
= 0.009
149
2. Sebuah kotak yang berisi empat kelereng, dengan warna putih sebanyak θ dan warna
hitam sebanyak 4-θ. Akan diuji dengan hipotesis alternatif . Ambil
dua kelereng dengan pengembalian dan menolak H0 jika kedua kelereng yang terambil
berwarna sama.
Penyelesaian:
a) Dari kotak yang beisi 4 kelereng diambil 2 kelereng dengan pengembalian sehingga
peluang terambilnya kelereng putih pada setiap pengambilan adalah
dengan ( ) dimana dan
Sehingga [ ] ( )
( )( ) ( )
[ ] [ ]
Jadi : dan
P[TI] ( | )
= ( | )
∑ ( )( ) ( )
= 0,8021
b) P[TII] ( | )
= ( | )
( )( ) ( )
150
a. Asumsikan bahwa = 4, akan diuji H0 : dengan Ha : , dengan tingkat
kepercayaan .
b. Berapa besar = P[TII] jika μ=105?
c. Berapa banyak sampel yang di butuhkan untuk mendapatkan nilai μ=10,5?
d. Ujilah hipotesis dari (a) jika tidak diketahui.
e. Ujilah H0 : dengan Ha : dengan tingkat kepercayaan α=0,01
f. Berapa sampel yang diperlukan untuk uji pada (e) agar 90% H0 ditolak dengan nilai
²=18?
Penyelesaian:
̂
a. Zn =
√
= √
=
= -2,237
= 2,33 -2,237<2,33
sehingga Z0>-Z1-α
Jadi H0 diterima.
b. β = P[TII] , μ=105
α = P[ menolak H0| H0 benar]
0,01= P[ ̂ < | ]
0,01= P[ ]
√ √
0,01= P[ √
]
0,01= P[ ]
-2,32=
-1,038= c-12
c = 10,96
β =P[TII]
= P[menerima H0| H0 salah]
=P[̂ ]
̂
= 1-P[ ]
√ √
= 1-P[ √
]
151
= 1-P[ ]
= 1-P[ ]
= 1-0,8485
= 0,1515
c. α = 0,9 , μ=10,5
= 1.β
Β= 0,1
( )
n=
( )
( )
=
( )
( )
= 4
( )
( )
= 4
=
= 23,2937 = 24
̂
d. t0 =
√
=
√
=
√
= = -1,119
-t1-d(n-1) = -t0,99(19)
= -2,359
10> t1-d (n-1)
-1,119>-2,539 , H0 diterima.
( )
e. V0 = α= ( )
( )
= = ( )
= = 33,778 = ( )
= 18,191
V0 ( ) , artinya H0 diterima.
f. 1. = 0,9
= 0,1
( ⁄ )
n =1+2[ ]
( ⁄ )
152
( ⁄ )
√
=1+2[ ]
( ⁄ )
√
=1+2[ ]
=1+2[ ]
= 1+2[ ]
= 1+2[23,9]
= 1+48
= 49
4. Andaikan koin bias yang telah didiskusikan di contoh 9.2.5, dimana probabilitas dari
kepala, p, diketahui 0.20 ,0.30, atau 0.80. Koin dilempar berulang kali dan diberikan X
jumlah lemparan untuk menentukan kepala pertama. Dilakukan pengujian pada
akan menolak jika dan tidak menolak yang lain. Tentukan:
Penyelesaian
a) = [ ]
= [ | ]
= [ | ]
= [ ]
√ ( ) √ ( )
( )
= [ ]
√ ( )( )
= [ ]
= [ ]
=1- [ ]
= 1 – 0,9932
= 0,0068
b) = [ ]
= [ | ]
= [ | ]
= [ ]
√ ( ) √ ( )
( )
= [ ]
√ ( )( )
153
= [ ]
= [ ]
= 0,999 1
c) = [ ]
= [ | ]
= [ | ]
= [ ]
√ ( ) √ ( )
( )
= [ ]
√ ( )( )
= [ ]
= [ ]
= 0,999 1
7. Sebuah koin dilempar sebanyak 20 kali dan (kepala yang muncul). Diberikan
(peluang dari munculnya kepala). Sebuah pengujian dengan dari
tingkat kepercayaan paling besar .
Penyelesaian
a.
√ ( )
Sehingga ditolak
b. ( )
( )
Sehingga ditolak
c. ( ) ( )
154
∑ ( )
( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( )
( )( ) ( ) ( )( ) ( ) ( )( ) ( )
d. -value ( )
∑ ( )
( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( )
( )( ) ( ) ( )( ) ( ) ( )( ) ( )
8. Andaikan jumlah cacat dari sebuah kawat panjang adalah t meter yang berdistribusi poisson
X ( ) dan salah satu kecacatan ditemukan pada 100 meter dari sebuah kawat.
Penyelesaian :
( )
a) s = 1 ; t = 100 ; α = 0,01
Uji statistik : ( ) ( ) ∑
768
( )
b) nilai p ( )
155
Nilai p = 0,04042768
c) s = 2 ; t = 200 ; α = 0,05
Uji statistik :
( ) ( )
∑
( )
d) ( ) ( )
∑
Penyelesaian
a.
156
( ) ( )
( ) ( )
( ) ( )
̅ ̅
<
< ( )
( ( ) ( ))
( ( ) ( ))
( )
( )
( )
<
< ( )
c. ̅ ∑ ̅ ̅
Dari 11.5.17
̅ ( )
= ( )
√
157
=
√
=
( ) = ( )
= ( )
=
( )
Artinya ditolak
d. =
=
=
( ) = ( )
=
( )
=
=
( )
Artinya diterima
e. Jika
( )
Jadi
11. Andaikan sebuah distribusi dengan pdf f(x;θ) = θ xθ-1 untuk 0<x<1 dan 0 untuk yang lain.
Penyelesaian
a) ( )
( )
( )
( )
( ) ( )
158
Untuk n = 1 didapatkan :
( ) ( ) ∏
[ ( ) ]
[ ]
[ ]
[ | ] [ | ]
[ | ]
b) [ ]
[ | ] [ | ]
[ | ] [ ]
[ ] ( )
[ | ]
Penyelesaian:
( )
( ) =
∑
=
159
∑
( ) =
∑
( ) =
Menurut Neyman-Pearson Lemma
( )
( ) = ( )
∑
= . ∑
∑
= ∑
Dimana adalah [ ( ) ]
[ ( ) |μ ] [ ( ) |μ ]
Sehingga [ | ]= [ | ]
( ) ( )
( )= ( )
( )
adalah harga yang memaksimumkan ( ) di mana harus dicari yang
memaksimalkan ( ) setelah data sampel diurutkan
Sehingga
( ) maksimum terjadi jika paling kecil sehingga
( )
( ) ( )
( ) ( )
( ) ( )
Jadi, GLRnya :
( )
( ) ( )
160
( )
( )
( )
( ) ( )
161
BAB XIII
TABEL KONTINGENSI DAN KEBAIKAN SUAI
13.1 PENDAHULUAN
Sebagian besar model yang dibahas pada bab sebelumnya telah ditunjukkan dengan
pdf ( ) yang diketahui sebagai bentuk suatu fungsi. Bahkan, sebagian besar metode
statistik telah dibahas dalam bab sebelumnya, seperti estimasi maksimum, yang diturunkan
relatif menjadi model ini. Dalam banyak situasi, tidak mungkin mengidentifikasi dengan
mudah model mana yang akan digunakan, sehingga metode statistik secara umum untuk
menguji kebaikan dan sesuaian model statistik yang relatif dalam bentuk sebuah data, sangat
diperlukan, yaitu dengan menggunakan tabel kontingensi.
Sebelumnya telah dibahas pengujian sampel binomial dan juga uji aproksimasi
berdasarkan pendekatan normal terhadap binomial tersebut. Uji aproksimasi juga dapat
dinyatakan dalam bentuk distribusi chi-square dan bentuk ini dapat digeneralisasi untuk
persoalan lebih dari dua jenis kemungkinan hasil dan lebih dari satu sampel.
Distribusi chi-square dari uji statistik didekati oleh distribusi normal yang
didistribusikan sebagai ( ) dan dapat dinyatakan sebagai berikut:
( ) ( ) ( )
( ) ( )
( ) [( ) ( )]
( )
( )
∑ (13.2.1)
Sebuah pendekatan pengujian berukuran adalah menolak jika ( ).
Statistik mencerminkan jumlah selisih antara hasil pengamatan dan hasil yang
diharapkan dalam . Dalam bentuk ini, perbedaan di kedua sel dikuadratkan, tetapi
perbedaannya bergantung linear karena ∑ ( ) dan jumlah derajat kebebasan
adalah jumlah sel dikurangi satu.
162
Tabel 13.1
Nilai hasil yang diharapkan dan diamati untuk percobaan Binomial
Kemungkinan Hasil Total
Probabilitas 1
Hasil Ekspetasi = = N
Hasil Pengamatan N
Harus diingat bahwa pendekatan chi-square dapat ditingkatkan dalam hal ini dengan
memperkenalkan koreksi untuk diskontinuitas. Dengan demikian, hasil akan lebih akurat
diperoleh dengan menggunakan statistik
(| | )
∑ (13.2.2)
Uji statistik dengan chi-square umumnya dapat dilakukan dengan dua cara, yaitu
dapat diperpanjang untuk diterapkan ke masalah multinomial dengan jenis hasil dan dapat
digenerasisasi untuk masalah r-sampel binomial, untuk selanjutnya akan dipertimbangkan
masalah r-sampel binomial pertama.
( )
∑ ∑ ( ) 13.3.1
Contoh 13.3.1
Karakteristik tertentu diyakini terdapat dalam 20% dari populasi. Sampel acak dengan ukuran
50, 100 dan 50 diuji dari masing-masing dari tiga jenis yang berbeda, dengan hasil yang
diamati ditunjukkan dalam tabel 13.2.
Diharapkan jumlah hasil di bawah kemudian
( ) ( ) dan ( ) Sisanya dapat diperoleh
dengan pengurangan dan ditampilkan dalam Tabel 13.3.
163
Tabel 13.2
Hasil Pengamatan Untuk 3 Sampel Uji Binomial
Hasil Pengamatan
Hadir Absen Total
Jenis 1 20 30 50
Jenis 2 25 75 100
Jenis 3 15 35 50
Tabel 13.3
Hasil Ekspetasi Untuk 3 Sampel Uji Binomial
Hasil Pengamatan
Hadir Absen Total
Jenis 1 10 40 50
Jenis 2 20 80 100
Jenis 3 10 40 50
didapatkan
( ) ( ) ( ) ( ) ( ) ( ) ( )
∑ ∑ +
= 17.18
∑ ∑
̂
Dan ̂ ̂ ̂ ( ̂ ), dimana ∑
( ̂ )
∑ ∑ (13.3.2)
̂
Distribusi limit dari uji statistik ini dapat ditampilkan menjadi chi-square dengan derajat
kebebasan r-1, sehingga sebuah pengujian pendekatan berukuran adalah menolak
jika:
164
( ) (13.3.3)
Pada umumnya dalam kasus ini, satu derajat kebebasan dihilangkan untuk setiap estimasi
parameter yang tidak diketahui. Sebenarnya hal ini sama untuk sampel normal, dimana
̅
∑ ( ) ( ) ∑ ( ) ( )
Tabel 13.4
Sampel Total
1
2
: : : :
: : : :
r
̂ ( ̂)
Dalam hal ini terdapat hubungan linear, karena ∑( ̅) dan efeknya adalah bahwa
jumlah terakhir setara dengan jumlah 1 kuadrat variabel independen yang normal standar.
Derajat kebebasan juga dapat digambarkan dengan mempertimbangkan tabel hasil
yang diamati dalam tabel 13.4. Mempunyai nilai tetap dari estimasi ̂ berarti mempunyai
semua dari total marjinal dalam tabel tetap. Sehingga nomor di bagian dalam tabel
dapat diberikan dan semua nomor yang tersisa kemudian akan ditentukan. Secara umum,
jumlah derajat kebebasan yang terkait dengan tabel dengan total marjinal tetap adalah
( ) ( ).
Contoh 13.3.2
Perhatikan kembali data dalam contoh 13.3.1, untuk menguji hipotesis proporsi sederhana
yang mengandung karakteristik yang sama dalam tiga jenis, Dalam
hal ini, ̂ ( ) ̂ ( ) dan jumlah sisanya dari nilai
yang diharapkan dapat diperoleh dengan pengurangan. Nilai-nilai yang diharapkan termasuk
dalam Tabel 13.5.
Dalam hal ini
( ̂ ) ( ) ( ) ( )
∑∑
̂
( ) ( ) ( )
165
Karena ( ) , kita tidak dapat menolak hipotesis proporsi yang umum pada
kondisi
Tabel 13.5
Hipotesis yang diamati dan diperkirakan di bawah angka nol dalam proporsi yang
sama.
Hadir Absen Total
Jenis 1 20(15) 30(35) 50
Jenis 2 25(30) 75(70) 100
Jenis 3 15(15) 35(35) 50
Total 60 140 200
Pada bagian 13.2 disebutkan bahwa koreksi untuk diskontinuitas dapat meningkatkan
akurasi dari pendekatan chi-square untuk ukuran sampel yang kecil. Pendekatan chi-kuadrat
umumnya dianggap cukup akurat untuk tujuan praktis jika semua nilai yang diharapkan
dalam sel masing-masing minimal 2 dan 80% dari 5 atau lebih.
( )
=∑ ~ ( ) 13.4.1
Ada kemungkinan untuk menunjukkan bahwa limit distribusi dari uji statistik dengan
adalah ( ) dan secara konsisten menyatakan bahwa perkiraan jumlah derajat
kebebasan dapat diperoleh dalam kondisi ini. Persamaan (13.2.1) menggambarkan bahwa
satu derajat kebebasan adalah tepat untuk kasus binomial dengan . Demikian juga
untuk menentukan ukuran sampel,dengan ( ) nilai yang diamati.
166
Contoh 13.4.1
Sebuah dadu dilempar 60 kali dan untuk mengujinya, diketahui bahwa , dimana j =
1,…,6. Dari H0 hasil yang diharapkan yaitu =10, maka :
( )
=∑
( ) ( ) ( ) ( )
=
= 6.0 < ( )
1 2 3 4 5 6
Pengamatan 8 11 5 12 15 9 60
Harapan 10 10 10 10 10 10 60
Tabel 13.6
( )
=∑ ~ ( )
dan
=∑ =∑ ∑ ( ) ⁄ ~ ( ( ))
dari
167
Permasalahan yang sering terjadi menguji apakah populasi multinomial adalah sama tanpa
menentukan nilai dari . Sehingga, kita dapatkan
: = = = untuk
̂ = ̂ = ⁄
=∑ ∑ ( ̂ ) ⁄ ̂ ~ (( )( )) 13.5.2
Contoh 13.5.1
Pada contoh 13.3.1, diketahui bahwa karakteristik dapat terjadi pada tiga tingkatan yang
berbeda yaitu absen, sedang, atau tinggi. Pada tabel 13.7, harapan untuk menguji : =
. Hasil pengamatan dapat dilihat pada tabel
13.8. Kemungkinan yang dapat diharapkan di bawah H0 adalah give in
parentheses, dimana ̂ = ̂ = ( ⁄ ) = 50(24/200) = 6, ̂ = ̂ =
( ⁄ ) = 9, ̂ = ̂ = ⁄ = 12, ̂ = ̂ = ( ⁄ ) = 18, dan
seterusnya.
( )
= ∑ ∑
( ) ( ) ( ) ( )
=
( ) ( ) ( ) ( )
( )
168
= 14.13 > 13.3 = ( )
Contoh 2 1
Contoh 3 1
1
Tabel 13.7
Kolom
1 2 3
Baris 1
Baris 2
Baris 3
1
Tabel 13.9
Perhatikan bahwa jumlah peluang bersama dalam hal ini ditambah 1, sedangkan
dalam tabel 13.7 peluang diperkirakan sesuai dengan peluang bersyarat, dan masing-masing
baris ditambah 1.
169
Dalam pengelompokan individu berdasarkan faktor pertama, tidak terpengaruh oleh
pengelompokan ke kategori lainnya. Sehingga, dikatakan independen jika pengelompokan
peluang bersama adalah hasil dari pengelompokan peluang marjinal,
̂ = ̂ = ̂ ̂ = ( )( ) =
Perhatikan bahwa ̂ mengurangi nilai yang sama, yang didapatkan dari uji persamaan
proporsi dengan sampel banyak. Sehingga, statistik chi-squared untuk mengukur kesesuaian
antara hasil pengamatan dan jumlah yang diharapkan dari , ̂ dapat diperoleh.
Demikian juga, hasil perkiraan asimtotik menunjukkan bahwa :
= ∑ ∑( ̂ )/ ~ (( )( ))
Contoh 13.6.1.
Survei diambil untuk menentukan apakah ada hubungan antara afiliasi politik dan
kekuatan dukungan untuk eksplorasi. Dipilih secara acak 100 orang untuk diminta afiliasi
politik dan tingkat dukungan untuk mendapatkan data. Ditunjukkan pada tabel 13.10.
( )
= ∑ ∑
( ) ( ) ( ) ( )
=
( ) ( ) ( ) ( )
Dukungan
Afiliasi
Meningkat Sama Menurun
Republik 8(9) 12(10.5) 10(10.5) 30
Demokrat 10(12) 17(14) 13(14) 40
170
Independen 12(9) 6(10.5) 12(10.5) 30
30 35 35 100
Tabel 13.10
Salah satu contoh kasus distribusi multinomial yang didiskusikan pada bagian 13.4
sesuai untuk melakukan percobaan apakah sampel acak berasal dari distribusi multinomial
yang lengkap. Uji ini dapat disuesuaiakan untuk menguji bahwa sampel acak dberasal dari
distribution khusus yang lengkap, ( ). Hanya membagi ruang sampel ke dalam
bagian c, dikatakan sehingga didapatkan [ ] dimana ( ).
Kemudian untuk sampel acak yang berukuran n, diberikan menunjukkan jumlah observasi
yang ke j. dibawah jumlah yang diharapkan pada bagian j adalah . Sekarang
kembali lagi ke dalam bentuk masalah multinomial, dan ( ) ditolak jika koefisien
kepercayaan jika
( )
∑ ( )
Pada beberapa kasus mungkin terdapat pilihan yang alami untuk bagian cell atau data
dikelompokkan untuk memulainya dinyatakan dengan cell buatan yang mungkin dipilih.
Sebagai prinsip umum, banyak cell yang mungkin seharusnya digunakan untuk
meningkatkan nilai dari derajat kebebasan, dengan atau uji statistic untuk chi square
cukup akurat.
Contoh 13.7.1
( ) ( ) ( )
( )
171
Sehingga dapat dikatakan bahwa ditolak H0 dengan α = 0,10
Tabel 13.11 Pengamatan dan nilai dugaan uji kebaikan suai distribusi chi –square untuk
model Poisson dengan rata – rata 3
Waktu Perbaikan
0 1 2 3 4 5 6 >7
(Hari)
Pengamatan 1 3 7 6 10 7 6 0
Nilai dugaan 2,00 5,96 8,96 8,96 6,72 4,04 2,00 1,39
7,96 7,40
Ketika menggunakan prosedur dari kebaikan suai untuk membantu memilih model populasi
yang tepat, biasanya tertarik untuk mencoba apakah beberapa jenis dari distribusi tersebut
dapat diestimasi. Seperti ( ) atau ( ) dimana nilai parameternya
tidak spesifik dari pada mencoba hipotesa seperti ( ) hal ini membuat kekurang
cocokannya karena kesalahan nilai parameter pada. Tetapi apakah model umumnya
mempunyai bentuk perkiraan dan akan menjadi model yang cocok ketika nilai perkiraan
parameternya digunakan
( ̂)
∑ ( )
̂
Dalam banyak kasus, estimasi MLE didasarkan pada pengelompokan data model multinomial
yang tidak mudah untuk dilaksanakan dan dipraktekkan yang didasarkan pada MLE yang
biasanya pada data yang tidak dikelompokkan
172
Jika MLE yang didasarkan pada orservasi individu yang digunakan, kemudian nilai
dari derajat kebebasan lebih baik dari c-1-k, tetapi distribusi limit dibatasi antara distribusi
chi square dengan c-1 dan c-1-k derajat kebebasan. Kebijakan disini adalah akan
menggunakan c-k-1 sebagai derajat kebebasan jika k merupakan estimasi parameter dari
banyak prosedure ML. pendekatan yang lebih konservatif akan terikat pada P-value pada
pengujian menggunakan c-1-k dan c-1 derajat kebebasan jika MLE tidak didasari langsung
pada pengelompokan data.
Contoh 13.7.2
Perhatikan kembali data yang dibeerikan oleh contoh 13.7.1 dan sekarang dianggap bahwa
harapan pada percobaan ( ). MLE dari µ adalah rata – rata dari 40 kali perbaikan,
dengan
[ ( ) ( ) ( ) ( )]
̂
(Hari)
Pengamatan 4 7 6 10 13
Didapatkan
( ) ( )
( )
Jadi sebuah model Poisson dapat memungkinkan untuk data ini, meskipun sebuah model
Poisson dengan µ=3 ditemukan tidak kebaikkan dengan baik. Dengan nilai derajat kebebasan
disini adalah 3, karena satu parameter telah diestimasi
173
13.8 UJI KEBAIKAN SUAI YANG LAIN
Beberapa kebaikan suai telah dikembangkan dalam hal fungsi distribusi empiris.
prinsip dasarnya adalah untuk melihat seberapa dekat distribusi sampel kumulatif diamati
setuju dengan hipotesis distribusi kumulatif teoritis. beberapa metode untuk mengukur
kedekatan perjanjian telah diusulkan.
Uji EDF umumnya dianggap lebih kuat daripada kebaikan chi-squared uji
kebaikansuai, karena memanfaatkan lebih langsung dari pengamatan individu. tentu saja,
maka tidak berlaku jika data yang tersedia hanya sebagai data dikelompokkan.
Diberikan menunjukkan sebuah sampel acak memerintahkan ukuran n.
maka EDF atau sampel CDF dinotasikan dengan , Dan pada nilai-nilai memerintahkan
dicatat bahwa ̂ ( )
jika kita ingin menguji hipotesis sepenuhnya ditentukan, ( ) maka dibandingkan
dengan pendekatan umum adalah untuk mengukur seberapa dekat perjanjian tersebut adalah
antara ( ) dan ̂ ( ) untuk i=1,…,n beberapa modifikasi sedikit telah ditemukan
untuklebihmembantu, seperti menggunakan koreksi setengah-point dan membandingkan
hipotesis ( ) nilai-nilai ke ( ) bukan untuk i / n .
karena ( ) ( ). Tes dari setiap H0 sepenuhnya ditetapkan dapat
dinyatakan dipersamakan sebagai tes untuk seragam, dimana ( ) didistribusikan
sebagai variabel diperintahkan seragam.
1 r
i 0.5 2
CM (F ( i:n ) )
12n i 1 n
Contoh 13.8.1
Diberikan 25 sistem kegagalan yang terjadi pada 100 hari periode dan menghitung berapa
kali kegagalan menggunakan distribusi Uniform, ( ) , dengan 25
pengamatan sebagai berikut:
174
5.2 13.6 14.5 14.6 20.5 38.5 42.0 44.5 46.7 48.5 50.3 56.4 61.7
62.9 64. 67.1 71.6 79.2 82.6 83.1 85.5 90.8 92.7 95.5 95.6
Didapatkan
∑( )
( )
Karena maka dapat dikatakan menolak H0 dengan α=0,10 pada level yang
diinginkan.
Jika sebuah proses Poisson diamati pada waktu t, maka diberikan nilai dugaan, kesuksesan
untuk menghitung berapa kali kegagalan adalah mengkondiikan distribusi dengan variable
diseragamkan.
Jika data dibawah direpresentasikan kesuksesan untuk menghitung berapa kali kegagalan dari
sebuah proses Poisson, maka waktu diantara kegagalan adalah variable dari independent
exponensial. Waktu antara peengamatan satu dengan yang lain:
5.2 8.4 0.9 0.1 5.9 17.9 3.6 2.5 1.2 1.8 1.8 6.1 5.3
1.2 1.2 3.0 3.5 7.6 3.4 0.5 2.4 5.3 1.9 2.8 0.1
Digunakan statistic CM untuk menguji data tersebut secara exponensial. Tunjukkan bahwa
( ). Didapat
∑( )
( )
seperti yang disarankan pada bagian sebelumnya kita sering kali lebih tertarik untuk menguji
apakah suatu keluarga tertentu daridistribusi berlaku daripada menguji hipotesis yang
sepenuhnya ditentukan. Untukmenguji ( ) dimana θ tidak dispesifikan
̂ ∑( ̂ ( ̂) )
Contoh 13.8.2
175
Sekarang kita melakukan sebuah test dimana waktu perbedaan didalam contoh sebelumnya
dengan distribusi exponensial, EXP(θ). Pada kasus ini, ̂ ̂ dan
̂ ∑( )
( )
D max(i / n F ( i:n ))
i
D max( D , D )
V D D
carets akan ditambahkan jika parameter yang tidak diketahui harus diestimasi
Contoh 13.8.3.
Perhatikan kembali contoh 13.8.2 menggunakan uji statistic Kolmogorov. Sebuah bagian dari
EDF ̂ ( ̂) dan estimasi CDF ( ̂) dapat ditunjukkan pada
gambar 13.1. Nilai D dapat ditunjukkan pada order statistic ke lima
176
KESIMPULAN
Tujuan kita di bab ini adalah untuk memperkenalkan beberapa tes yang didesain baik
untuk menentukan apakah distribusi hipotesis memberikan model yang memadai atau untuk
menentukan. apakah variabel acak independen.
Tes chi-kuadrat didasarkan pada ukuran relatif dari perbedaan antara frekuensi yang
diamati dan frekuensi teoritik diprediksi oleh model. mereka memiliki adventages menjadi
cukup sederhana dan juga memiliki pendekatandistribusi chi-kuadrat.
SOAL-SOAL LATIHAN
1. Pada sebuah permainan baseball terdapat 300 pemukul, untuk sesi pertama ada 100
pukulan mendapatkan 20 pukulan. Gunakan persamaan (13.2.1) untuk menguji
terhadap dengan sebagai tingkat kepercayaan. Apa yang bisa dilakukan
untuk pengujian satu arah?
Jawab:
= 3.33+1.3 = 4.63
Menurut Tabel:
( ) ( ) ( )
2. Koin dilempar 20 kali dan didapatkan 7 kepala. Percobaan ini unbiased dengan
sebagai tingkat kepercayaan. Gunakan persamaan (13.2.1) dan (13.2.2).
Jawab:
177
( ) ( ) ( )
∑
= 1.8
( ) ( ) ( )
(| | ) (| | ) (| | )
∑
( ) ( ) ( )
3. Diberikan contoh 13.3.1 yang akan ditunjukkan dengan data sebagai berikut:
Tabel Pengamatan:
Hasil Pengamatan
Hadir Absen Total
Jenis 1 10 40 50
Jenis 2 50 50 100
Jenis 3 30 20 50
Jawab:
(a)
Tabel Ekspetasi:
Hasil Pengamatan
Hadir Absen Total
Jenis 1 12.5 37.5 50
178
Jenis 2 50 50 100
Jenis 3 25 25 50
( ) ( ) ( ) ( ) ( )
∑∑
( ) ( )
Menurut Tabel:
( )
(b)
Tabel Ekspetasi:
Hasil Pengamatan
Hadir Absen Total
Jenis 1 25 25 50
Jenis 2 50 50 100
Jenis 3 25 25 50
( ) ( ) ( ) ( ) ( )
∑∑
( ) ( )
Menurut Tabel:
( )
(c) ( ⁄ )
( ⁄ )
( ⁄ )
Tabel Ekspetasi:
179
Hasil Pengamatan
Hadir Absen Total
Jenis 1 22.5 47.5 50
Jenis 2 45 55 100
Jenis 3 22.5 47.5 50
( ) ( ) ( ) ( ) ( )
∑∑
( ) ( )
Menurut Tabel:
( )
5. Dalam masalah genetic, terjadi perbedaan warna yaitu coklat, putih, dan spot. Peluang
yang terjadi pada warna coklat ¼, warna putih ¼, dan warna spot ½.
Penyelesaian :
̂ ( ) , ̂ ( ) , ̂ ( )
( )
=∑
( ) ( ) ( )
+ + =5> ( ) ( )
Jadi, H0 ditolak
b. Uji hipotesis dengan taraf nyata dengan peluang berturut – turut coklat, putih, spot
adalah 1/9, 4/9,4/9
Penyelesaian :
180
̂ ( ) , ̂ ( ) , ̂ ( )
( )
=∑
( ) ( ) ( )
+ + = 0.78 < ( ) ( )
6. Sampel dari 36 kartu dengan pengembalian dari tumpukan 52 kartu dengan komposisi
sebagai berikut :
Penyelesaian :
̂ ( ) , ̂ ( ) , ̂ ( ) , ̂
( )
( )
=∑
( ) ( ) ( ) ( )
+ + + = 4.9 < ( ) ( )
181
11. Sampel dari 400 orang yang setuju mendukung keseimbangan anggaran belanja dan
mereka yang setuju mendukung pengetahuan umum dapat dilihat dalam tabel berikut :
Penyelesaian :
̂ ( ) , ̂ ( ) ̂ ( ) ,
̂ ( ) , ̂ ( ) , ̂ ( )
̂ ( ) , ̂ ( ) , ̂ ( )
( ̂ )
= ∑∑
̂
( ) ( ) ( ) ( ) ( ) ( ) ( )
+ + + + + + +
( ) ( )
+
= 17.89 > ( ) ( )
Jadi, Ho ditolak
8. Sebuah balok terdapat 5 kelereng hitam dan 10 kelereng putih. Pemain A dan Pemain B
mengambil 3 kelereng dari balok dan mencatat berapa kali kelereng hitam terambil. Pemain
A dan Pemain B mempunyai 100 kali kesempatan pengambilan dengan hasil sebagai berikut:
0 1 2 3
Pemain A 25 40 25 10
182
Pemain B 40 40 15 5
Gunakan persamaan 13.5.2 untuk menguji hipotesis bahwa 2 populasi multinomial adalah
sama dengan
Penyelesaian:
Persamaan 13.5.2
( ̂ )
∑∑ (( )( ))
̂
Dengan ̂
̂ , ̂ , dan seterusnya
Sehingga didapat tabel
0 1 2 3
Pemain A 25 (32,5) 40 (40) 25 (20) 10 (7,5) 100
Pemain B 40 (32,5) 40 (40) 15 (20) 5 (7,5) 100
65 80 40 15 200
( ) ( ) ( )
Sedangkan
(( )( )) (( )( )) ( )
Karena ( ). Jadi dikatakan menolak (tidak menerima) H0
9. Sebuah survey telah disebarkan sebagai distribusi pada penyewaan peternakan dalam
suatu periode waktu di Audobon County, Iowa, dengan persamaan 3 perbedaan level
kesuburan tanah. Dibawah ini adalah hasil survey yang dikutib dari Snedecor (1956,
halaman 225):
Soil Owned Rented Mixed
I 36 67 49 152
II 31 60 49 140
III 58 87 80 225
Uji Hipotesis daari populasi multinomial untuk 3 perbedaan level kesuburan tanah dengan
Penyelesaian :
Pada soal ini, digunakan subbab 13.6
Dengan
̂ , ̂ , dan seterusnya
Sehingga didapat tabel:
Soil Owned Rented Mixed
I 36 (36,7) 67 (62,9) 49 (52,3) 152
183
II 31 (33,8) 60 (57,9) 49 (48,2) 140
III 58 (54,4) 87 (93,1) 80 (77,5) 225
125 214 178
( ̂ )
∑∑ (( )( ))
̂
( ) ( ) ( )
Sedangkan
(( )( )) (( )( )) ( )
Karena ( ). Jadi dikatakan tidak dapat menolak (menerima) H0
10. Sebuah kerusakan komponen pesawat terbang dapat dibedakan menjadi 3 jenis, yaitu
mesin, aliran listrik, dan lainnya. Dua desaign pesawat terbang telah diciptakan dan terdapat
keinginan untuk menguji hipotesis kerusakan komponen pada desaign pesawat terbang. Uji
hipotesis dengan pada data dibawah ini:
Mesin Aliran Listrik Lainnya
Desaign 1 50 30 60 140
Desaign 2 40 30 40 110
Penyelesaian:
Pada soal ini, digunakan subbab 13.6
Dengan ̂
̂ , ̂ , dan seterusnya
Sehingga didapat tabel
Mesin Aliran Listrik Lainnya
Desaign 1 50 (50,4) 30 (33,6) 60 (56) 140
Desaign 2 40 (39,6) 30 (26,4) 40 (44) 110
90 60 100 250
( ̂ )
∑∑ (( )( ))
̂
( ) ( ) ( )
Sedangkan
(( )( )) (( )( )) ( )
Karena ( ). Jadi dikatakan tidak dapat menolak (menerima) H0
184
DAFTAR PUSTAKA
Bain, Lee J, 1992, Introduction to Probability and Mathematical Statistics Second Edition,
Duxbury Press, California.
185