Anda di halaman 1dari 185

BAB VII

DISTRIBUSI LIMIT
7.1 PENDAHULUAN
Di bab 6 telah dibahas metode umum untuk mendapatkan fungsi sebuah distribusi dari
(
). Pada beberapa kejadian, pdf dari
variabel acak yaitu
dapat dicari
dengan mudah. Namun terdapat kejadian yang tidak mudah untuk diselesaikan. Beberapa di
antaranya, untuk mendapatkan hasil pendekatan dengan n bernilai besar. Hasil tersebut
didasarkan pada dugaan konvergensi dari distribusi limit.
7.2 BARISAN DARI PEUBAH ACAK
Perhatikan suatu barisan peubah acak Y1,Y2, yang berkaitan dengan barisan CDF nya
yaitu G1(y), G2 (y), untuk setiap n=1,2,
( )
[
]
(7.2.1)
DEFINISI 7.2.1
Jika Yn~Gn(y), untuk setiap n=1,2, dan jika untuk beberapa CDF G(y) yaitu,
( )
( )
(7.2.2)
untuk semua nilai y dimana G(y) kontinu, pada barisan Y1,Y2.. dikatakan konvergen dalam
distribusi Y~G(y), dan dinyatakan dengan Yn d
Y ,CDF G(Y) disebut : Distribusi
terbatas dari Yn.
Contoh 7.2.1
Diberikan X1,X2,Xn sampel acak dari sebuah distribusi uniform Xi~UNIF(0,1) , dan
Yn:Xn:n merupakan order statistik terbesar, dengan CDF= ( )
, untuk
Dapatkan distribusi limit dari Yn=Xn:n.
Penyelesaian:
PDF distribusi Uniform :
Xi~UNIF(0,1) ( )
CDF distribusi Uniform : ( )

( )

Yn= Xn:n adalah order statistik terbesar,dan untuk mencari CDF dari Yn yaitu sebagai berikut:
( )
[
]
[ ( )]
( )
(7.2.3)
Sehingga didapatkan,
Gn(y)={

Untuk
merupakan fungsi konstan dengan masing-masing 0 dan 1.
Distribusi limit dari Yn yaitu :

( )

( )

Jadi,
G(y) = {

(7.2.4)

merupakan distribusi limit untuk Yn

Gambar 7.1 : Grafik dari CDF Gn(y) dengan limit degenerate CDF G(y)
DEFINISI 7.2.2
Fungsi G(y) adalah CDF dari suatu distribusi degenerate pada nilai y=c, diperoleh
G(y) = {

(7.2.5)

Dengan kata lain, G(y) adalah CDF dari sebuah distribusi diskrit yang mempunyai peluang
sama dengan 1 di nilai y=c dan 0 untuk yang lain.
Contoh 7.2.2
Diberikan X1,X2,Xn adalah sebuah sampel acak dari distribusi eksponensial, Xi~EXP(),
dan Yn=X1:n adalah order statistik terkecil. Tentukan distribusi limit untuk Yn .
Penyelesaian :
PDF distribusi Eksponensial:
X~EXP() ( )
CDF distribusi Eksponensial:
( )

CDF dari Yn adalah


( )
[
]
[
( )]
[

( )
(7.2.6)
( )
dan 0 untuk y yang lain. Kita mempunyai ( )
jika y>0 karena dalam
kejadian ini
. Jadi, limitnya 0 jika y<0 dan 1 jika y>0, yang mana distribusi
degenerate pada nilai y=0. Pembentukan nilai limit di y=0 adalah 0, artinya bahwa fungsi

limit tidak hanya diskontinu di y=0 tetapi juga tidak kontinu di bagian kanan y=0, yang mana
telah menjadi syarat sebuah CDF.
DEFINISI 7.2.3
Sebuah barisan peubah acak Y1,Y2,dikatakan konvergen stokastik ke konstanta c jika
mempunyai distribusi limit yang degenerate pada y=c.
Tambahan: Berikut adalah persamaan limit yang sering di gunakan dalam menyelesaikan
soal distribusi limit yaitu
(
(

(limit natural)
( )

(7.2.7)
( )

jika

(7.2.8)

Contoh 7.2.3
Diberikan X1,X2,Xn adalah sebuah sampel acak dari distribusi pareto, Xi~PAR(1,1), dan
Yn=nX1:n order statistik terkecil . Dapatkan distribusi limit dari Yn.
Penyelesaian :
( )

PDF distribusi Pareto: Xi~PAR(1,1) yaitu


(

CDF distribusi Pareto:

( )

( )

( )

(
(

)
)

Misalkan :

Sedangkan, CDF dari Yn adalah:


( )

]
[

( )]

[
( )

) ]

(7.2.9)

Dengan menggunakan limit natural pada persamaan 7.2.4, kita peroleh distribusi limit
sebagai berikut:
( )
( )
(

( )
dan 0 untuk yang lain, yang merupakan CDF dari distribusi eksponensial, EXP(1). Ini jika
diilustrasikan di dalam gambar 7.2, yang mana menunjukkan grafik dari G(y) dan Gn(Y)
untuk n=1,2, dan 5

Gambar 7.2 : Grafik dari CDF Gn(y) dengan distribusi limit G(y)
Contoh 7.2.4
Untuk sampel acak dari contoh sebelumnya 7.2.3, tetapi dengan Yn=Xn:n yang mana
merupakan order statistik terbesar. Dapatkan distribusi limit dari Yn.
Penyelesaian:
CDF dari contoh 7.2.3 yaitu :
( )
CDF dari Yn adalah :

( )

[
[ ( )]
[

( )

]
]

(7.2.10)

Dan 0 untuk y yang lain. Karena


( )
dengan

( )

, kita dapatkan distribusi limit yaitu:

untuk semua y, dimana bukan CDF karena tidak mendekati 1

Contoh 7.2.5
Pada contoh sebelumnya yaitu contoh 7.2.3 dengan

( )

adalah order statistik

terbesar. Dapatkan distribusi limit dari Yn.


Penyelesaian :
CDF dari contoh 7.2.3 yaitu :
( )
CDF dari Yn adalah:

( )

[
[ ( )]

( )
Distribusi limitnya yaitu :

( )

(7.2.11)

( )
[

( )
Contoh 7.2.6
Dari sebuah sampel acak pada contoh 7.2.2 dengan
statistik terbesar. Dapatkan distribusi limit dari Yn.
Penyelesaian :
CDF dari contoh 7.2.2 yaitu :
( )
CDF dari Yn adalah:

( )

[
[ ( )]

( )

adalah order

[
(

[
( )

Distribusi Limitnya yaitu : ( )

(7.2.12)

( )
[

( )
(
)
Sekarang menghitung ketelitian saat melimitkan CDF dengan pendekatan Gn(y) untuk n yang
besar. Misalkan waktu bertahan dalam bulan untuk beberapa tipe dari komponen variabel
acak X~EXP(1) dan misalkan 10 komponen yang independen tersebut terhubung dengan
sistem parallel. Waktu kegagalan dari sistem adalah T=X10:10, dan CDFnya
( ) (
)
Untuk pendekatan ini digunakan distribusi limit CDF:
( )
[
]
[
]
(
)
(
)
(
)
(
)
Misalkan t yang digunakan pada saat t=1,2,5 dan 7 bulan , maka pendekatan peluangnya
diperoleh sebagai berikut:
t:
1
2
5
7
0.010
0.234
0.935
0.9909
( )
0.025
0.258
0.935
0.9909
(
)
Jadi , nilai pendekatan meningkat ketika n bertambah.
Contoh 7.2.7
Diberikan sebuah sampel mean dari sampel acak yang berdistribusi normal

Pdf distribusi normal :


(

( )

CDF dari distribusi normal :


( )

), dan

( )

CDF dari Yn adalah :

[
[
( )

Limit dari CDF Yn degenerate pada


jika

dan 1 jika

(7.2.13)

karena,

( )

( )

jika

, jadi sampel mean konvergen stokastik ke .

7.3 TEOREMA LIMIT PUSAT


TEOREMA 7.3.1
Misal
adalah barisan variabel acak dengan CDF masing-masing ( ) ( ) dan
( )
( )
dengan MGF masing-masing
Jika ( ) adalah MGF dari CDF ( )
( )
( ) untuk semua
pada selang terbuka
, maka
( )
( ) untuk semua titik kontinu pada ( ).

Contoh 7.3.1
Diberikan X1, ..., Xn adalah sampel acak dari distribusi Bernoulli,
( ) dan

. Jika
untuk
dengan
untuk
. Dapatkan distribusi
limit dari Yn.
Penyelesaian :
PDF distribusi Bernoulli :
( ) ( )
MGF distribusi Bernoulli :
( )

Sedangkan untuk MGF dari CDF Gn(y) yaitu :


( ) (
)
(
( )

)
(

(7.3.1)

Menurut limit natural pada persamaan (7.2.7), didapakan


(
)
( )
( )
(7.3.2)
yaitu MGF dari distribusi Poisson dengan mean . Hal ini konsisten dengan hasil dari

( ).

Teorema 3.2.3, sehingga dapat disimpulkan

Contoh 7.3.2
Hukum Bernoulli untuk Nilai yang Besar
Misalkan terdapat tetap dan mengingat barisan dari proporsi sampel,

Dengan menggunakan deret ekspansi


dengan
distribusi limit dari Wn .
Penyelesaian:
PDF distribusi Bernoulli :
( ) ( )
MGF distribusi Bernoulli :
( )
( )

.
. Dapatkan

[ (

)
( )

(7.3.3)

Dimana ( ) meliputi bentuk yang diabaikan dari deret ekspansi, dan


. Dari limit (7.2.8) didapat
( )

( )

untuk

(7.3.4)

dan konvergen stokastik pada

dimana MGF dari distribusi berada pada


mendekati tak hingga.

untuk

Contoh 7.3.3
Mengingat barisan variabel yang terstandarisasi:
(7.3.5)

Dengan notasi yang disederhanakan


, didapat

distribusi Limitnya.
Penyelesaian:
Dengan menggunakan deret ekspansi dari contoh sebelumnya,

)]

( )
[
[(

)(
( )

[
Dimana ( )
( )

. Dapatkan

)]

untuk

(7.3.6)
. Jadi,

(7.3.7)

yaitu MGF dari distribusi normal standar, dan maka


dari hasil limit khusus yang disebut Teorema Limit Pusat.

). Ini merupakan contoh

TEOREMA 7.3.2
Teorema Limit Pusat
Jika
adalah sampel acak dari distribusi dengan mean dan variansi
limit distribusi dari

, lalu
(7.3.8)

adalah normal standar,maka

) untuk

Contoh 7.3.4
Diberikan
adalah sampel acak dari distribusi uniform,

. Dapatkan Yn dengan pendekatan distribusi normal.


Penyelesaian:
Pdf distribusi Uniform:

) dan

Xi~UNIF(0,1) ( )
CDF distribusi Uniform :
( )

( )

Mean dari distribusi Uniform :


( )
Variansi dari distribusi Uniform:
( )
Karena ( )

dan

( )

didapat perkiraan
(
)
(

( )
Sebagai contoh, jika
, kemudian dengan perkiraan
Perkiraan ini sangat dekat, sering digunakan untuk mensimulasikan nomor acak normal
standar pada aplikasi komputer.
7.4 PENDEKATAN UNTUK DISTRIBUSI BINOMIAL
Contoh 7.3.1 sampai 7.3.3 menunjukkan macam-macam distribusi limit yang tergantung
pada barisan dari variabel binomial dan diasumsikan sifat dari p dengan
.
Contoh 7.3.1 ditunjukkan untuk variabel binomial Yn ~ BIN (n,p) jika n besar dan p
kecil, maka dapat didekati dengan Yn ~ POI(n,p). Pembahasan ini ditunjukkan dengan cara
lain dalam contoh 3.2.9 pada Bab 3 yaitu:

Contoh 3.2.9:
Misalkan 1% dari produksi transistor sebuah perusahaan adalah cacat. Sebuah model baru
komputer membutuhkan 100 transistor dan 100 transistor tersebut diseleksi acak dari
perakitan perusahaan. Diperoleh 3 transistor cacat dalam pengacakan tersebut, maka
peluangnya diperoleh transistor cacat
(
(

( )

)(

) (

Dan pendekatan dengan distribusi Poissonnya yaitu:


(

Contoh 7.3.3 , dengan p dan barisan baku yang sesuai digunakan untuk distribusi normal
standart, maka menggunakan sebuah pendekatan normal. Dalam kenyataannya, hal tersebut
digunakan untuk nilai n yang besar dan memiliki nilai p maka didekati dengan Yn
~N(np,npq). Pendekatan ini bekerja paling baik ketika nilai p=0,5 karena distribusi binomial
simetri ketika p=0,5. Ketepatan ini tergantung pada aplikasinya. Pedoman digunakan untuk
distribusi normal standart ketika
dan
, tetapi tetap memerlukan ketelitian.
Contoh 7.4.1 :
Peluang seorang pemain basket melakukan sebuah penembakan adalah p = 0,5. Jika pemain
melakukan 20 penembakan, berapa peluang pemain melakukan penembakan paling sedikit 9
kali?
Penyelesaian :
Yn~BIN(n,p)
n = 20
p = 0,5
q = 0,5
np = nq = 10 5 sehingga dipendekatan Yn ~N(np,npq)
Penyelesaian :
P [Y209] = 1 - P[Y208]
=1

Sebuah pendekatan normal


P [Y209] = 1 - P[Y208]
= 1-

= 1 - ( - 0,89 )
= 0,8133

10

Karena distribusi binomial merupakan distribusi distribusi diskrit dan distribusi normal
merupakan distribusi kontinu, pendekatannya dapat diperbaiki dengan membuat sebuah
koreksi kontinuitas.
Kenyataannya, masing-masing distribusi binomial , (
),
mempunyai hasil yang sama dengan luas sebuah persegi panjang dengan tinggi (
) dan
selang [
] sebagai dasarnya, karena panjang dasarnya 1. Daerah persegi
panjang tersebut dapat dipendekatan dengan daerah dibawah PDF dari
(
), yang
berhubungan dengan distribusi normal dengan mean dan varians
(
). Hal tersebut
ditunjukkan untuk n=20, p=0.5 dan y=7 dalam gambar 7.3, dimana probabilitasnya adalah
(

)(

) (

Aprosikmasi ditunjukkan dengan daerah yang diarsir pada gambar,


Gambar 7.3 koreksi kontinuitas untuk pendekatan normal dari sebuah probabilitas binomial

Cara yang sama dapat digunakan untuk probabilitas binomial, seperti


[
]
[
]
(
(

)
)

yang lebih mendekati nilai yang sebenarnya tanpa koreksi kontinuitas. Keadaan ini
ditunjukkan dalam gambar 7.4.
(
)
Umumnya, jika
adalah bilangan bulat , maka

11

(7.4.1)

Koreksi kontinuitas juga berguna untuk distribusi diskrit yang dapat dipendekatan
dengan distribusi normal.
Gambar 7.4 pendekatan normal untuk distribusi binomial

Contoh 7.4.2
Misalkan
diketahui bahwa

( ) dimana n adalah bilangan bulat positif. Dari hasil pada bab 6,


mempunyai distribusi yang sama dengan jumlahan
, dimana

X1,.,Xn independen, Xi~POI(1) . Berdasarkan teorema limit pusat ,

( ) yang menunjukkan pendekatan Yn~N(n,n) untuk n yang besar. Sebgai


]
contoh, n=20, Berapakah nilai [
Penyelesaian :
Diketahui :
]
Ditanya : [
Jawab : PDF poisson f(x;) =

= 0,982

Dan nilai pendekatannya


(

)= (

12

7.5 DISTRIBUSI NORMAL ASIMPTOTIK


Akibat dari teorema limit pusat , jika sampel meannya distandarisasi berdasarkan pada

persamaan 7.3.13 yaitu

yang berhubungan dengan barisan Zn

Z~N(0.1).

Hal tersebut tidak sesuai untuk distribusi dengan sampel mean sebagai pendekatan
dari N(, 2/n) untuk n yang besar.berikut ini contoh dari dugaan yang lebih umum.
DEFINISI 7.5.1
Jika
adalah barisan variabel acak, serta

untuk
asimptotik

dan

konstan, maka
(7.5.1)

, dan dikatakan
mempunyai distribusi normal asimptotik dengan mean
dan variansi asimptotik

Contoh 7.5.1
Berdasarkan sampel acak dalam contoh 4.6.3 yang menunjukkan n=40 daya tahan sebuah
peralatan elektrik, Xi~EXP(100). Dengan teorema limit pusat ,
Mempunyai distribusi normal asimptotik dengan mean =100 dan varians c2/n=(100)2/40=250.
7.5.1 DISTRIBUSI ASIMTOTIK DARI ORDER STATISTIK PUSAT
Dalam subbab 7.1 ditunjukkan beberapa contoh yang menggunakan order statistik
ekstri,misalkan yang terbesar atau yang terkecil, dengan distribusi limit yang tidak normal.
Dalam keadaan lain, mungkin untuk menunjukkan pusat order statistikyang normal
asimptotik.
Teorema 7.5.1
Misalkan
adalah sampel acak dari sebuah distribusi kontinu dengan pdf ( ) yang
kontinu dan tidak nol pada persentil ke- ,
, untuk
. Jika
(dengan
tertentu), maka barisan order statistik ke- ,
, adalah normal asimptotik dengan
mean
dan variansi , dimana
(

[ (

)]

(7.5.2)

Contoh 7.5.2
Misalkan
adalah sampel acak dari distribusi eksponensial,
( )
(
dan ( )
. Untuk n ganjil,
adalah median dari sampel. Jika
, maka mediannya
( )
maka
= 0.5
(

13

( ), sehingga
) , sehingga

Dan

[ (

)]

Dengan demikian,
asimptotik

normal asimptotik dengan mean asimptotik

dan variansi

Contoh 7.5.3
Misalkan X1,., Xn adalah sebuah sampel acak dari distribusi uniform, Xi ~ UNIF (0,1),
sehingga PDF nya :
( )
CDF nya :
( )

( )

( )

( )

( )

| = x-0 = x ; 0<x<1
Diasumsikan bahwa n adalah bilangan ganjil dan k=(n+1)/2, sehingga Yk=Xk:n adalah
order statistik pusat atau median sampel. Persamaan 6.5.3 yaitu
( )

[ ( )] [
( )]
( )]
(
) (
)
menjelaskan pdf dari Yk yang memiliki bentuk khusus karena k-1=n-k=(n-1)/2 dalam contoh
ini. Maka, PDF nya adalah
( )
{[

[ (

)]

(7.5.3)

]}

Berdasarkan teorema, dengan p=0.5, persentil ke p, X0.5=0.5 dan c2=0.5(1-0.5) / 12 =


)
(
dengan pdf pada 7.5.3 setelah transformasi
0.25, sehingga

transformasi invers
( )

(
{[

)
(

]}

| |

Z~N(0.1). sebenarnya ini sangat berkaitan

)
, yang memiliki
(
dan jacobian J=1/ . hasil PDFnya adalah

(7.5.4)

Dari limit (7.2.7) dan hasil bahwa (1-z2/n)-1/2


(

1, maka

Dan hal ini menunjukkan nilai konstan pada (7.5.4) yang mendekati 1/

14

dengan n

7.6 SIFAT-SIFAT KONVERGENSI STATISTIK


Untuk mengetahui apakah suatu estimator merupakan sebuah estimator yang baik adalah
dengan sifat antara lain konvergen stokastik ke nilai parameternya untuk
TEOREMA 7.6.1
Barisan Y1,Y2, konvergen stokastik ke c, jika dan hanya jika untuk setiap =0,
[|
|
]
(7.6.1)
Sebuah barisan dari variabel acak yang memenuhi teorema (7.6.1) disebut konvergen dalam
probabilitas ke konstanta c, dinotasikan dengan Yn

c.

Contoh 7.6.1:
Contoh 7.3.2 terbukti, sehingga disebut hukum Bernoulli Law of Large Numbers
(LLN) dengan pendekatan MGF. Itu juga dapat diuji dengan teorema sebelumnya dan
dengan pertidaksamaan Chebychev. Secara khusus, mean dan varians dari pn adalah
E (pn) = p dan Var (pn) = pq/n , jadi
P[ | pn p | < ] 1 pq/ 2n
[|
| ]
1
pq/ 2n
1-0
1
[|
| ]
Maka , untuk setiap > 0, maka
Pendekatan yang sama juga bisa digunakan untuk membuktikan hasil yang lebih umum,
biasanya disebut sebagai Law of Large Numbers (LLN).
Teorema 7.6.2
Jika X1, X2, . . . , Xn adalah contoh acak dari distribusi dengan mean () berhingga dan
varians (2), maka barisan dari sampel mean konvergen dengan peluang ke :

Bukti : Dari E( ) =
Var ( )=

, dengan demikian
[|

(7.6.3)

Sehingga,
[|

Jadi,
[|

15

Teorema 7.6.3
(

Z~N(0,1), maka

Contoh 7.6.2 :
Diketahui bahwa dalam contoh 7.5.2 dan 7.5.3 bahwa median sampel Xk:n adalah normal
asimptotik dengan mean asimptotik x0.5 .Sehingga dalam teorema diperoleh bahwa Xk:n
x0.5 dengan n dan k/n 0.5.
Maka sesuai teorema 7.5.1 jika k/n
p, maka order statistik konvergen stokastik terkecil
pada persentil ke p adalah Xk:n

xp

7.7 TEOREMA LIMIT TAMBAHAN


DEFINISI 7.7.1 (Konvergensi pada Peluang)
Barisan variabel acak

dikatakan konvergen pada peluang pada , ditulis


[|
|
]
(7.7.1)

jika

TEOREMA 7.7.1
Untuk barisan variabel acak, jika
maka
melimitkan distribusi berarti menurunkan distribusi
untuk mendefinisikan konvergensi stokastik.

. Untuk kejadian khusus


,
[
]
. Kondisi ini digunakan

TEOREMA 7.7.2
Jika
( )

, maka untuk setiap fungsi ( ) yang kontinu di ,


( )

BUKTI
Karena ( ) kontinu di , hal tersebut berarti untuk setiap
|
|
( )|
berakibat | ( )
. Hal ini berakibat

dan
[| ( )

ada, dimana
( )|
]

[|
|
] karena ( )
( ) sebagaimana
. Tetapi karena
, hal itu
[| ( )
( )|
]
[|
|
berarti untuk setiap
berlaku
]
. Limit pada ruas kanan tidak mungkin melebihi 1, maka harus sama dengan 1, dan
( )

( ).

16

TEOREMA 7.7.3
Jika

dan

adalah dua barisan variabel acak yang mana

dan

dan

).

1.
2.

3.

untuk

4.

5.

jk [

utk semua

jk [

utk semua .

CONTOH 7.7.1
(
).
Misal

Diketahui
Maka (

.
(

TEOREMA 7.7.4 (Teorema Slutsky)


Jika

dan

adalah dua barisan variabel acak yang mana

1.
2.

untuk
3.
Untuk kejadian khusus,
bisa jadi barisan luar biasa seperti
CONTOH 7.7.2
Dari sampel acak berukuran

( )
)
(
Juga diketahui jika (
menjadi

dari distribusi Bernoulli,

)
(

), diketahui

) maka jika dibagi dengan [ (

) (

)]

(7.7.2)

TEOREMA 7.7.5
Jika
, maka untuk setiap fungsi kontin ( )u berlaku
( ) tidak bergantung pada .

17

( )

( ), dengan asumsi

TEOREMA 7.7.6
Jika (

( )

maka

) dan jika

( ) mempunyai turunan bukan nol pada

[ ( ) ( )]
( )|
|

BUKTI
( )](
)
( ) jika
Didefinisikan ( ) [ ( )
, dan misal
Hal tersebut berarti ( ) kontinu di dengan ( )
, dan dengan demikian
( )

( )

Selanjutnya,

( )

( ).

[ ( ) ( )]
( )|
|

) [

( )

( )

)]

( )] ( )
Dari teorema 7.7.3 didapat [ ( )
, dan hasilnya didapat dari teorema
7.7.4.
Berdasarkan pemahaman awal dari distribusi normal asimptotik, dapat disimpulkan untuk
(
) maka
bernilai besar, jika
[ ( )]
( )
{ ( )
}

Contoh 7.7.3
Teorema Limit Pusat menyebutkan bahwa mean dari sampel terdistribusi normal asimptotik,
(

Atau perkiraan untuk

)
yang bernilai besar,

Diketahui dari teorema 7.7.6 bahwa fungsi yang dapat diturunkan dari juga terdistribusi
normal asimptotik. Sebagai contoh, jika ( ) , maka ( )
, dan diperkirakan
( )

[
]

7.8* DISTRIBUSI ASIMPTOTIK DARI ORDER STATISTIK TERTINGGI


Seperti yang telah disebutkan pada subbab 7.5, order statistik pusat, Xk:n , yang
didistribusikan sebagai normal asimptotik yaitu n dan

p. Jika order statistik ekstrim

seperti X1:n, X2:n, dan Xn:n distandarisasi sehingga tidak mendegenerasikan pembatasan
distribusi, pembatasan distribusi ini bukan termasuk distribusi normal. Contohnya dari
pembatasan distribusi seperti yang diberikan sebelumnya. Itu dapat ditunjukkan bahwa tanpa
mendegenerasikan pembatasan distribusi dari variable ekstrim harus termasuk ke dalam satu
dari 3 kemungkinan tipe dari distribusi. Sehingga 3 tipe dari distribusi ini berguna saat
mempelajari rataan melalui Terorema Limit Pusat.

18

TEOREMA 7.8.1
Jika limit dari barisan CDF adalah CDF kontinu, ( )
(

dan bn yaitu

Jika dan hanya jika

( ) , kemudian untuk an > 0

(7.8.1)

dan

TEOREMA 7.8.2
Jika limit dari barisan CDF adalah CDF kontinu, dan jika
(
)
( ) untuk semua n > 0 dan semua Real y,
(

Kemudian
(

( ) untuk n > 0, jika dan hanya jika

dan

dengan n .

7.8.1 DISTRIBUSI LIMIT MAKSIMUM


Diberikan X1:n,, Xn:n menunjukkan sampel acak dengan ukuran n dari distribusi
CDF F(x). Di dalam konteks teori nilai ekstrim, nilai maksimum Xn:n adalah yang
mempunyai distribusi limit G(y) jika ada barisan dari standarisasi konstan { n} dan {bn}
dengan

> 0 seperti bahwa standar variable,

, konvergen dalam distribusi

G(y) yaitu:
(

Y ~ G(y)

(7.8.2)

Jika Xn:n memiliki distribusi terbatas dengan tipe G , itu berarti bahwa pembatasan
distribusi dengan standar variable Yn adalah tidak menurunkan distribusi G(y). Mengingat
bahwa distribusi yang tepat dari Xn:n diberilan oleh
( ) [ ( )]
(7.8.3)
(

Jika kita pertimbangkan


( )

, kemudian distribusi yang tepat dari Yn adalah

)
)]
[ (
(7.8.4)
Sehingga , pembatasan distribusi dari Xn:n (atau lebih tepatnya Yn) adalah diberikan oleh
( )
)]
( )
[ (
(7.8.5)
Sehingga, persamaan 7.8.5 menyediakan pendekatan langsung untuk menentukan nilai
limit distribusi ekstrim (tertinggi), jika barisan {an} dan {bn} dapat ditentukan bahwa hasilnya
adalah limit yang didegenerasikan.
Mengingat dari contoh 7.2.6 bahwa jika X~EXP(1), kemudian dengan an= 1 dan bn = ln n.
Sehingga,
dan ( )

( )

[ (
[[

( )

)]
]]

[[

( )
(

]]
)

19

(7.8.6)
(7.8.7)

Teorema 7.8.3
Jika

memiliki distribusi limit G(y) , kemudian G(y) harus memenuhi 3 tipe

nilai distribusi tertinggi:


1. Tipe I (untuk maksimum) (tipe eksponensial)
( )
( )
(
) , -<y<
2. Tipe II (untuk maksimum) (tipe chauchy)
( )
( )
(
) , y > 0, > 0
3. Tipe III (untuk maksimum) (tipe limit)
( )
( )
[ ( ) ] , y < 0, > 0
1
,y0

(7.8.8)
(7.8.9)
(7.8.10)

TEOREMA 7.8.4
(

Dalam menentukan pembatasan distribusi dari


( )

[ (

Jika dan hanya jika

)]
[

( )
(

,
(7.8.11)

)]

( )

(7.8.12)

Diberikan CDF F(x) yang mungkin dapat menggunakan teorema 7.8.4 untuk menyelesaikan
an dan bn pada F(x) untuk setiap 3 tipe pembatasan distribusi. Sehingga, jika tipe limit untuk
F(x) diketahui, kemudian an dan bn dapat di hitung. Jika tipe tidak diketahui, maka an dan bn
tetap dapat dihitung untuk setiap jenis dan kemudian diterapkan untuk melihat tipe hasilnya.
Satu sifat dari CDF yang digunakan dalam mengekspresikan konstanta standar yaitu
Karakteristik Nilai Terbesar
DEFINISI 7.8.1
Karakteristik nilai terbesar, Un, dari CDF F(x) di definisikan oleh persamaan
[
( )]
(7.8.13)
Untuk sampel acak dengan ukuran n dari F(x), jumlah yang diharapkan dari pengamatan yang
akan melebihi Un adalah 1. Peluang bahwa sebuah pengamatan akan melebihi Un adalah
[
]
( )
dan jumlah yang diharapkan untuk pengamatan n independen adalah
[
( )]
Teorema 7.8.5
Diberikan X~F(x), dan asumsikan bahwa

memiliki pembatasan distribusi.

1. Jika F(x) adalah kontinu dan naik tegas, kemudian distribusi limit dari Yn adalah tipe
Eksponensial jika dan hanya jika
[
(
)]
, -<y<
(7.8.14)

20

Dimana bn = Un dan an adalah solusi dari


(
)
( )
2. G(y) adalah tipe Cauchy jika dan hanya jika
( )
(

, k > 0, > 0

(7.8.15)

dan dalam hal ini, an = Un dan bn = 0


3. G(y) adalah tipe Limit jika dan hanya jika
(
(

dimana

)
)

,k>0
{ | ( )

(7.8.16)
}, batas atas dari x. Juga bn = x0 dan an = x0 Un.

7.8.2 DISTRIBUSI LIMIT MINIMUM


Jika sebuah pembatasan distribusi tidak turun untuk contoh acak minimum, maka juga
harus termasuk satu dari tiga tipe yang memungkinkan. Memang sebuah distribusi minimum
dapat berhubungan dengan distribusi maksimum, karena
(
)
(
)
Jadi semua hasil maksimum dapat diubah menjadi bentuk minimum jika detailnya dapat
diurutkan.
( )
( ) Catatan X1:n=-Zn:n.
Misalkan x kontinu, X~Fx(X) dan
Sekarang menganggap bahwa
(
)
.Kita mempunyai,
( )

]
= [
=1- (
)
Pembatasan distribusi dari Wn disebut H(w) kemudian diberikan dengan
( )
( )
(
)
(

Dimana G(y) sekarang menunjukkan pembatasan distribusi dari


(
)
.
Sehingga untuk menemukan H(w), distribusi terbatas untuk minimum. Langkah pertamanya
( )
menentukan ( )
dan pembatasan distribusi
G(y) dengan metode penggambaran untuk maksimum, sebagai terapan dari ( ).
(
)
Kemudian pembatasan distribusi dari Wn adalah ( )
Catatan : jika ( ) harusnyauntuk limit tipe 1, mungkin ( ) memiliki tipe yang
berbeda. Sebagai contoh maksimum dari EXP() mempunyai pembatasan distribusi tipe 1,
sedangkan ( ) memiliki tipe tiga, maka pembatasan distribusi dapat diubah menjadi tipe
tiga.
DEFINISI 7.8.2
Nilai karakteristik yang paling kecil adalah Sn yang didefinisikan dengan
( )
(7.8.24)

21

TEOREMA 7.8.6
Jika
(
)
mempunyai pembatasan distribusi H(w), kemudian H(w) harus
mengikuti salah satu dari tiga nilai distribusi tertinggi.
1. Tipe I ( untuk minimum) (tipe eksponensial)
Dalam keadaan ini
didefinisikan oleh
(

Dan ,
( )

( )
( )
(
)
(
),
(
)
Jika dan hanya jika
2. Tipe II (untuk minimum) (tipe Cauchy)
Dakam keadaan ini
( )

( )

( )

[ (

dan

) ,

>0

Jika dan hanya jika


(

, k>0, >0 atau

, y>0

3. Tipe III (untuk minimum)(tipe limit)


{ | ( )
} merupakan penurunan limit untuk x (dimana
Jika
) kemudian

=-

Dan
( )

( )

( )

),

>0

Jika dan hanya jika


(
(

)
)

RANGKUMAN
Tujuan dari bab ini adalah untuk membahas dugaan dalam kekonvergenan sebuah
distribusi, distribusi limit, dan kekonvergenan dalam probabilitas. Konsep ini sangat penting
untuk dipelajari melalui sifat-sifat asimptotik dari barisan variabel acak dan distribusnya.
The Law of large Number (LLN) dan Teorema Limit Pusat (CLT) berhubungan dengan
sifat limit dari fungsi tertentu sebuah rataan sampel yang berarti ukuran sampel mendekati tak
hingga. Khususnya, LLN menyatakan bahwa barisan dari rataan sampel bersifat konvergen
stokastik pada rataan populasi suatu kondisi tertentu. Tipe kekonvergenan ini ekuivalen
dengan kekonvergenan pada peluang kasus ini, karena limitnya bernilai konstan. Sedangkan,
CLT menyatakan bahwa mengubah yang sesuai dengan bentuk barisan dari rataan sampel
adalah distribusi limit normal. Teorema ini memiliki dampak teoritis yang penting pada

22

peluang dan statistik, dan juga memberikan pendekatan pada banyak situasi . Contohnya,
CLT memberikan pendekatan yang bagus untuk distribusi binomial.
SOAL-SOAL LATIHAN
1. Diberikan sebuah sampel acak dengan ukuran n dari sebuah distribusi dengan CDF
( )

a. Dapatkan CDF dengan order statistik terkecil


b. Dapatkan distribusi limit dari
c. Dapatkan distribusi limit dari
Penyelesaian :
a. CDF : ( )
, dan CDF ( )

Dengan order statistik terkecil


Sehingga CDF untuk
( )

yaitu :
]

( )]

)]

( )

Jadi didapatkan,
( )

( )

b. Dengan menggunakan definisi 7.2.1 yaitu :


( )
( )
Sehingga dapat dicari distribusi limitnya adalah :
( )

( )
( )
( )

( )
Jadi didapatkan distribusi limit dari

( ) yaitu ( )

23

dan degenerate ke y=1

c. Dengan
Sehingga CDF dari
( )

yaitu :

( )]

[
(

maka

)]

Distribusi limitnya yaitu :


( )

( )

( )
Jadi didapatkan distribusi limit dari
( )

2.
(
a.
b.

( ) adalah

Diberikan sebuah sampel acak berukuran n dari sebuah distribusi dengan CDF
) (
) , untuk semua x bilangan real.
Dengan order statistik terbesar Xn:n, apakah mempunyai distribusi limit?
Dengan
, apakah mempunyai distribusi limit? Jika iya, tunjukkan!

Penyelesaian :
)
a. PDF : ( ) (
Dengan order statistik terbesar Yn=Xn:n , dan CDF ( )
Sehingga CDF untuk Yn=Xn:n yaitu :
( )

[ ( )]
[(
(

) ]
)

Distribusi limitnya yaitu :

24

( )

( )
(

( ) tidak mempunyai distribusi limit saat

Jadi

b. Dengan
Sehingga CDF dari
( )

yaitu :

[ ( )]
(

[(

[(

) ]

) ]

))

Distribusi limitnya yaitu :


( )

( )
(

))

))

Jadi didapatkan distribusi limit dari


( )

yaitu

))

3. Diberikan sampel acak dengan ukuran n dari sebuah distribusi dengan CDF
( )

Tentukan distribusi limitnya jika:


a.
b.
c.
Penyelesaian :
a. Dengan order statistik terkecil

dan ( )

25

Sehingga CDF untuk


( )

yaitu :
]

( )]

)]

Distribusi Limitnya adalah :


( )

( )

Jadi didapatkan distribusi limit dari

( ) yaitu ( )

dan degenerate ke y=1

b. Dengan order statistik terbesar


Sehingga CDF untuk
yaitu:
( )

[ ( )]
[

Distribusi limitnya adalah :


( )

( )
[

( ) tidak mempunyai distribusi limit saat

Jadi

c. Dengan
Sehingga CDF untuk
( )

yaitu :
]

[ ( )]
[

) ]

[
[

]
]

26

)
]

Distribusi limitnya adalah:


( )

( )
(

)
]

Jadi didapatkan ,
( )

{
(

9. Diketahui X1,X2,,X100 adalah sebuah sampel acak dari distribusi eksponensial.


Xi~EXP(1) dan Y=X1+X2++X100
(a) Tentukan pendekatan untuk P[Y>110]

(b) jika adalah sampel mean, maka aproksimasi dari P[


]
Penyelesaian :
Diket : Xi~EXP(1)
PDF dari Xi~EXP(1) , (

)
CDF dari Xi~EXP(1) , (
(a) P[Y>110] =1-P[Y 110]
= 1- [

= 1- [ ]
=1-0,8413 = 0,1587
(b) P[

]=

[
)

[ ( )]
= [ ( )]
[ ]
= [ ]
=0.9772-0.8413 = 0.1359
15. Diketahui pdf,

27

( )

Tentukan:
(a) Jika

, maka tentukan pendekatan

[
(b) Jika

]
merupakan nilai terkecil dari n, maka tunjukkan bahwa

dimana

(c) Jika
merupakan nilai terbesar dari n, maka tunjukkan bahwa
dimana
)
(d) Temukan distribusi terbatas dari (
(e) Temukan distribusi normal asimptotik dari median,

, dimana

terbatas.
(f) Tentukan
dari (e) yang merupakan stokastik konvergen?
(g) Tentukan distribusi terbatas dari

Penyelesaian:
( )

( )

( )

(a)
( )

]
[

28

dengan

(b)

( )]

( ) ]

( )
( )
Jadi,
( ( ))

(c)

[|

[|

[ |( ( ))

( ( ))
[|

Jadi,
(d)

(
( )

)
[

[(

]
(

[ (

) ]

[(

(e)

( )
(

) ]

( )
(

(
29
[ (

)]

[ (

)]
(

)
(

(
Jadi

)
)

normal asimptotik dengan asimptotik mean


(

dan

(f)
Dari (e) diketahui bahwa

asimptotik normal dengan mean

dapat disimpulkan bahwa

(g)
( )

]
[

]
[

[ (

]]

)]]

) ]

30

. Sehingga

)]
(

16. Terdapat sampel acak dari distribusi Poisson,


( ).

(a) Tunjukkan bahwa


stokastik konvergen ke [
(b) Temukan distribusi normal asimptotik dari
(c) Tunjukkan bahwa
( ) stokastik konvergen ke [

.
]

Penyelesaian:
(a) ( )

Jadi terbukti bahwa


(

(b)

stokastik konvergen ke [

Karena
maka

(
(

(c)
[

( )

)
)

Jadi terbukti bahwa

17.

( ) stokastik konvergen ke [

merupakan sampel acak berukuran dari distribusi normal,


(
dan merupakan median sampel. Temukan dan yang menyatakan bahwa
merupakan normal asimptotik

).

Penyelesaian:

31

( ( ) )

) )

Jadi dapat disimpulkan bahwa

).

18. Dari soal no. 1, temukan distribusi terbatas dari


Penyelesaian:
( )

[
[

]
]
[

[
(

)]
)]

Jadi,
( )

19. Dari soal no. 2, temukan distribusi terbatas dari ( )


Penyelesaian:
( )
( )

)
)

32

( )

]
(

[( )
[
[

Sehingga didapat ;

]
( )

[
[

]
]

20. Dengan menggunakan Teorema 7.5.1 :


(a) Tunjukkan bahwa
stokastik konvergen ke
(b) Tunjukkan bahwa (
Penyelesaian:
(a) Misal diketahui

jika diketahui ( ) kontinu.

, dimana

merupakan mean dan


(

terbatas

merupakan varians dimana;

[ (
Jadi

dengan

)]
normal asimptotik dengan asimptotik mean

[ (

)]

(b) Jika (

dan

sehingga

maka

, dimana

dengan

terbatas. Hal ini

artinya, pdf ( ) kontinu dan tidak bernilai 0 pada persentil ke-p,


Sedangkan

merupakan mean saat

varians dengan

[ (

)]

normal asimptotik dan

.
merupakan

Jadi dapat disimpulkan bahwa ( ) kontinu untuk memenuhi (

33

BAB VIII
STATISTIK DAN DISTRIBUSI SAMPLING
8.1 PENGANTAR
Pada Bab 4 telah diterangkan tentang sampel acak. fungsi distribusi empiris digunakan
untuk memberikan alasan mean sampel dan varians sampel sebagai perkiraan intuitif mean
dan varians dari populasi distributi. Tujuan dari bab ini adalah untuk memperkenalkan
konsep statistik, yang meliputi sampel mean dan varians sampel sebagai kasus khusus, dan
untuk mendapatkan sifat statistik tertentu yang memainkan peran penting dalam bab-bab
selanjutnya
8.2 STATISTIK
Terdapat himpunan teramati dari variabel acak,
Sebagai contoh, terdapat
variabel yang merupakan sampel acak berukuran

dari suatu populasi.

DEFENISI 8.2.1
Jika terdapat fungsi dari variabel acak,
parameter yang tidak diketahui, maka disebut statistik

, dimana tidak dipengaruhi oleh

Dalam notasi ini, lambang


adalah fungsi yang kita gunakan dalam
untuk
menentukan statistik, yang dilambangkan oleh kapital T. diperlukan bahwa variabel dapat
diamati karena penggunaan yang dimaksudkan dari statistik. Tujuannya adalah untuk
membuat kesimpulan tentang distrubuti dari himpunan variabel acak, dan jika variabel tidak
teramati atau jika fungsi
, tergantung pada parameter yang tidak diketahui, maka
T tidak mempengaruhi dalam membuat kesimpulan seperti itu. Sebagai contoh, mengenai
data lihat contoh pada bab 4.6.3 tentang mencari order dataterkecil sampai terbesar yang
diperoleh dengan mengamati tahan dari 40 bagian listrik yang dipilih secara acak. adalah
wajar untuk menganggap bahwa adalah nilai-nilai observased sampel acak dengan ukuran 40
dari populasi semua bagian seperti biasanya, populasi tersebut akan memiliki satu atau lebih
parameter yang tidak diketahui, seperti populasi yang tidak diketahui un berarti, katakanlah
. Untuk membuat inferensi tentang populasi, misalkan perlu numerik mengevaluasi
beberapa fungsi dari data yang juga tergantung pada parameter yang tidak diketahui kita,
seperti

, =

, atau

tersebut akan menjadi tidak mungkin, karena


cocok untuk mendefinisikan statistik.
Contoh 8.2.1

. Tentunya perhitungan

tidak diketahui, dan fungsi-fungsi tidak akan

Jika terdapat
yang merupakan sampel acak dari suatu populasi dengan pdf
Mean sampel dalam statistik diberikan dengan fungsi

Biasanya ditulis seperti berikut:

34

Ketika sampel acak merupakan nilai dari

, maka perhitungan dari data biasanya di

tulis dengan yang berguna untuk memperkirakan mean populasi,


Teorema 8.2.1
Jika
maka

merupakan sampel acak dari

dengan

dan

Dan

Contoh 8.2.2
Terdapat variabel acak
distribusi Binomial,
dengan

, dan terdapat sampel acak dengan ukuran n dari


. Mean dan varians dari populasi adalah

. Mean sampel dalam hal ini adalah

variabel binomial dan biasanya disebut proporsi sampel, ditulis


Untuk menunjukan bahwa

merupakan perkiraan dari

dengan

dan
merupakan

maka,

Sehingga didapat,

Contoh 8.2.3
Terdapat fungsi
berikut :

. Varians sampel diberikan sebagai

Maka didapat:

35

Teorema 8.2.2
Jika

merupakan sampel acak dengan ukuran n dari


dan

dengan

, maka didapat :

Pembuktian:

8.3 DISTRIBUSI SAMPLING


Distribusi dari statistik merupakan penjelasan untuk distribusi sampling, yang berbeda
dengan distribusi populasi. Banyak statistic penting yang dapat ditulis dengan kombinasi
linear dari variabel acak normal yang independen.
8.3.1 KOMBINASI LINEAR DARI VARIABEL NORMAL
Teorema 8.3.1
Jika

merupakan variabel normal independen, maka

Pembuktian :

Yang merupakan MGF dari variabel normal dengan mean

36

dan varians

Akibatnya : jika Xi,...,Xn merupakan sampel acak dari


8.3.2 DISTRIBUSI CHI-SQUARE
Distribusi Gamma dengan =2 dan =

maka

disebut distribusi Chi-Square. Atau bisa

dituliskan sebagai berikut


Teorema 8.3.2

Jika

, maka

Teorema 8.3.3

Jika

, maka

Pembuktian:

Ini merupakan distribusi Chi-Square dengan derajat kebebassan 2.CDF Gamma juga dapat
dinyatakan dalam bentuk notasi Chi-Square. Jika
Square dengan derajat bebas v], maka :
Teorema 8.3.4
Jika

Pembuktian:

37

dan jika

[CDF Chi-

Yang merupakan MGF dari


Teorema 8.3.5
Jika

Pembuktian:

Yang merupakan MGF dari


Sebagai akibat :
Jika Xi,...,Xn merupakan sampel acak dari

maka :

Teorema 8.3.6

Jika Xi,...,Xn merupakan sampel acak dari


1.

dan suku-suku

2.

dan S2 adalah independen

maka :

adalah independen

3.
Pembuktian :
1) Dengan menambah dan mengurangkan x dengan hubungan :

Jadi densitas bersama dari Xi,...,Xn dinyatakan sebagai :

38

Perhatikan transformasi bersama :

Maka :

dan

adalah konstan dan dapat ditunjukkan bahwa


. Selanjutnya faktor-faktor fungsi
densitas bersama adalah perkalian fungsi densitas marginal
saja. Ini
menunjukkan bahwa

dan suku-suku

independen, karena

.
Terbukti bahwa dan suku-suku
Karena
terbukti
independen.
2) Perhatikan bahwa

adalah independen
, Maka berdasarkan bukti diatas

Dari akibat 8.3.2 :


Dan
Jadi
Contoh 8.3.6:
1. Berapa waktu yang dibutuhkan suatu komponen dengan distribusi Gamma dengan =
3 dan =2. Dimana komponen tersebut dapat bertahan 90%. Sedemikian hingga
.
Penyelesaian :
Dengan demikian :

39

Maka :

untuk = 3 dan =2

2. X dinotasikan berat karung makanan,


beratnya minimal 1 ton?
Penyelesaian :

. Berapa peluang dari tas yang

; n=20 ; = 101 ;

Setelah dilihat di tabel distribusi normal, hasilnya adalah 0,987.


8.3.3 DISTRIBUSI t, F DAN BETA
DISTRIBUSI STUDENTS t
Diketahui bahwa
dapat digunakan untuk menarik kesimpulan mengenai parameter
dalam distribusi normal. Dengan cara yang sama,
distribusi dari

tergantung pada parameter

berguna untuk parameter

. Hal ini membuat suatu ketidakmungkinan

untuk menggunakan
dalam bentuk pasti dari prosedur statistik yang berkaitan dengan
mean ketika
tidak diketahui.

Ini berbeda, jika

digantikan dengan S dalam

digunakan tidak lagi standar normal, tapi tidak bergantung pada


menggunakan metode transformasi.

40

,maka distribusi yang


dan itu diselesaikan

Teorema 8.3.3
Jika
distribusi dari

dan

, dan jika Z dan V independen , maka

Disebut Distribusi Students t dengan v derajat kebebasan, dinotasikan


. Pdf nya sebagai berikut :

Pembuktian :
Hasil dari Z dan V bisa dibuktikan dengan cara :

Terdapat transformasi ,
Jacobiannya yaitu

dengan transformasi invers


dan

Setelah disederhanakan, pdf marginalnya ;


sehingga sesuai dengan persamaan dalam teorema 8.4.1
Teorema 8.3.4
Jika

, dengan

Pembuktian :
Pada saat 2r yaitu :

dimana
memberikan hasil.

dan

. Substitusi dari distribusi normal dan chi-square dituntut

41

Seperti yang dijelaskan di awal, satu aplikasi dari distribusi t akan muncul ketika
terdapat sampling dari distribusi normal, seperti yang diilustrasikan pada teorema ini.
Teorema 8.3.5
Jika

dinotasikan dengan sample random dari

, maka

Pembuktian :
Dari teorema 8.4.1 didapat

dan dari teorema 8.3.6 didapat

, maka

dan

adalah independen.

DISTRIBUSI SNEDECORS F
Teorema 8.3.6
Jika

independen, maka variable random

dengan pdf untuk

Ini disebut Distribusi Snedecors F dengan derajat kebebasan yaitu


dinotasikan
pada

). Beberapa penulis lebih suka menggunakan notasi

untuk menyimbolkan rasio seperti dalam teorema 8.4.4.

42

dan
dari

Teorema 8.3.7
Jika

, maka

Pembuktian :
Terdapat
dan

adalah independen, dan chi-square (8.3.6). sehingga dapat diperoleh:


Persentil
dari
adalah

yang diberikan pada Tabel 7 (Appendix C) untuk nilai


kecil dari

dan

dapat diperoleh dengan menggunakan

. Persentil untuk nilai


), kemudian

).
Jadi diperoleh ,

sehingga didapatkan ,

Contoh 8.3.7:
dan

adalah sampel acak yang independen dari populasi dengan

distribusi masing-masing adalah

Jika
didapatkan

dan

maka

dan didapatkan pula

43

dan

, sehingga

dan

Jika

dan

, maka

, dan untuk kedua sampel itu

biasanya memiliki 95% kepercayaan bahwa rasio


dibahas di bab selanjutnya.

. Notasi ini akan

DISTRIBUSI BETA
Sebuah variabel F dapat ditransformasikan ke distribusi beta. Jika
memiliki variable acak seperti berikut

mempunyai pdf

dimana

dan

Pdf ini menjelaskan tentang distribusi beta dengan parameter


dinotasikan
Mean dan varians dari

Persentil keyaitu :

dan

.
di tulis sebagai berikut;

dari distribusi beta dapat ditulis dengan bentuk persentil dari distribusi

Jika
dan
adalah bilangan bulat positif, maka diintegralkan secara berurutan
dengan bagian utama untuk hubungan antara CDF dari distribusi beta dan distribusi binomial.
Jika

dan
, maka
Distribusi beta muncul dalam hubungan dengan distribusi dari statistik order. Untuk

variable acak kontinu


, pdf dari statistic order ke-k dalam sampel acak dengan
ukuran n diberikan sebagai berikut.

44

Dibuat perubahan dari variabel


Karena
uniform. CDF dari

dimana

maka didapat

dan
merupakan order terbesar ke-k dari variabel acak
dapat ditulis dengan bentuk CDF beta, karena

dinotasikan dengan CDF dari

Contoh 8.3.8
Diketahui
Dimana

dan menghitung kemungkinan yang berhubungan dengan

dan

Dimana di akhir peluang ini memerlukan variable berdistibusi


Dengan demikian untuk nilai dari

dan

, peluang ini dapat diperoleh dari table

komulatif beta atau dari table komulatif


jika terdapat kecocokan
level.
Tujuan dari ilustrasi tersebut, agar kita dapat mengetahui
seperti;
, kemudian

dan

Jika n = 11, k = 6, dan = 0.95, maka ;


dan
atau
dimana
adalah median dari sample dan
adalah mean dari populasi.
Kita dapat mengetahui tentang definisi distribusi beta dan dapat mengetahui
hubungannya dengan distribusi
dan CDF binomial, seperti aplikasi untuk distribusi dari
variabel acak uniform berorder. Distribusi beta menjelaskan tentang distribusi uniform secara

45

umum dan melengkapinya dengan model dua-parameter fleksibel untuk berbagai tipe dari
variabel yang terletak antara 0 dan 1.
8.4 PENDEKATAN SAMPEL BESAR
Distribusi sampling yang telah dibahas pada awal bab memiliki pendekatan yang dapat
digunakan untuk penerapan ukuran sampel yang besar.
Teorema 8.4.1
Jika

, maka

Dimana,

Pembuktian :
merupakan distribusi penjumlahan,
maka diperolah
Contoh 8.4.1
Diketahui
dengan

dan

dimana

independen dan

merupakan varians sampel dari sampel acak dengan ukuran

dari
;

Dari teorema 8.5.1 didapat

Maka,

Atau pendekatannya,

Jika
dan
diperoleh sebagai berikut,

, maka

dan pendekatannya

Terdapat kemungkinan yang menunjukkan bahwa variabel distribusi t mempunyai batas


standart distribusi normal dengan derajat kebebasan
hal tersebut maka diketahui
, dimana

46

yang meningkat. Untuk mengetahui

dan dengan pertidaksamaan Chebychevs

Dikatahui juga bahwa

didapat
sehingga didapat
Jadi dapat disimpulkan bahwa distribusi Students t mempunyai batas standart distribusi
normal yang dapat ditulis sebagai berikut:

SOAL-SOAL LATIHAN

1.

X dinotasikan berat karung makanan,


beratnya minimal 1 ton?
Penyelesaian :
(

). Berapa peluang dari tas yang

)
; n=20 ; = 101 ;

Setelah dilihat di tabel distribusi normal, hasilnya adalah 0,987.


2.

Berapa waktu yang dibutuhkan suatu komponen dengan distribusi Gamma dengan = 3
dan =2. Dimana komponen tersebut dapat bertahan 90%. Sedemikian hingga [
]
.

Penyelesaian :
[

Dengan demikian :
( )
Maka :

47

( )

untuk = 3 dan =2
(

3.

( )(

( ). Tentukan c sehingga

Terdapat sampel acak dengan ukuran n=15 berdistribusi


[
]= 0.95, dimana merupakan mean sampel.

Penyelesaian :

( )
[
]

( )

Jadi, didapat
maka
4. Terdapat
merupakan sampel acak dari distribusi normal,
(
) dan

merupakan mean sample dan varians sampel. Gunakan tabel dari Appendix C
(

untuk menentukan [

Penyelesaian :
(

menurut teorema 8.4.3 bisa didekati dengan distribusi-t

( )]

48

5.

Bandingkan pendekatan The Wilson-Hilferty (persamaan 8.5.2) dengan nilai pada tabel
( )
( )
untuk
Penyelesaian :
Pendekatan The Wilson-Hilfery

(
(
6.

)
(

) adalah CDF dari


( ) dan
Buktikan jika (
distribusi chi-square dengan derajat bebas v, maka (

(
)

( ) berkorespondensi

Gunakan teorema 3.3.2 dan akibat dari

) adalah CDF dari


[
(
)].
(

Penyelesaian :
(

CDF dari distribusi chi-square adalah

Teorema 3.3.2
(

CDF dari Poison (

( )

Maka terbukti bahwa (

Dimana

7.

dan
[

)]

Seorang analisis keuangan mengambil suatu sampel sebesar 10% 300 laporan keuangan
dan mendapatkan bahwa rata-rata keuntungan Rp. 148,50 dengan standart deviasi Rp.
35,75. Jika rata-rata keuntungan populasi Rp. 138,00 , berapakah probabilitas bahwa
keuntungan yang diperoleh dan diambil secara random Rp. 148,50 atau lebih dan
tentukan jumlahnya?

Penyelesaian :

49

Dengan demikian,
(
)
Jumlahnya
( (
( (
(
)(

8.

)=
))
))

Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dibutuhkan oleh sebuah
mesin untuk memproduksi suatu kertas. Diambil secara random 36 rim kertas, waktu
rata-rata yang dibutuhkan untuk memproduksi 1 rim adalah 1,5 menit. Jika diasumsikan
standart deviasi populasi 0,30 menit, Tentukan estimasi interval rata-rata dengan tingkat
konfidensi 95 persen

Penyelesaian :

Nilai kesalahan standart dari proses sampling :

Dengan tingkat konfidensi 95 %, nilai


rata-rata :

(
)

9.

. Dengan dimasi demikian estimasi interval

Seorang investor pada saat ini memegang saham kelompok aneka industri yang terdiri
dari industri mesin dan alat berat, otomotif, tekstil, dan garmen. Pengamatan selama 2
bulan terakhir menunjukkan bahwa 44% probabilitas harga saham kelompok ini
meningkat. Investor lain ternyata memegang saham kelompok perdagangan dengan
probabilitas harga saham meningkat sebesar 67%. Apabila investor memiliki 100 lot
untuk saham aneka industri dan 200 lot untuk saham perdagangan, berapa probabilitas
beda presentasi harga saham kelompok perdagangan meningkat 10% lebih besar
dibandingkan dengan kenaikan harga saham kelompok aneka industri ?

Penyelesaian :
Perdagangan :
Aneka industri :
Beda proporsi atau selisih proporsi
Standar deviasi dari selisih proporsi adalah :

50

=
(

=
Nilai

diperoleh dengan
(

)
(

Jadi

)
)

(
)
(
)
. Jadi selisih harga
saham meningkat lebih dari 10% adalah 98,46% Hal ini menunjukkan bahwa ada
perbedaan yang cukup besar antara kenaikan harga saham kelompok aneka industri dan
perdagangan.

10. Sebuah bank Danamon di pasar bursa terus mengalami fluktuasi. Harga saham pernah
turun mencapai 1200 dan naik mencapai 1600. Selama pengamatan 60 hari harga saham
bank Danamon rata-rata mencapai 1400 dengan standar deviasi 98. Berapa peluang bank
Danamon turun di bawah 1350 dan berapa peluang harganya meningkat di atas 1500 ?
Penyelesaian :

Z=

Nilai Z pada tabel luas dibawah kurva normal = 0,49996


sehingga

51

BAB IX
ESTIMASI TITIK
9.1. Pendahuluan
Pada bab ini akan diasumsikan bahwa distribusi dari suatu populasi dapat
direpresentasikan oleh anggota dari suatu pdf keluarga, (
) berparameter . Pada
beberapa kasus, parameternya akan menjadi nilai vektor dan akan digunakan untuk
mendapatkannya.
Dimisalkan sebagai parameter populasi dan adalah himpunan semua nilai yang
mungkin. Jika adalah vektor maka akan menjadi himpunan bagian dari ruang Euclidean
pada dimensi yang sama dan dimensi akan berkaitan dengan nilai parameter lain yang
tidak diketahui. Diasumsikan bahwa (X1, X2, , Xn) adalah sampel acak dari (
) dan
() adalah suatu fungsi dari .
Definisi 9.1.1
Suatu statistik T =(X1, X2, , Xn) digunakan untuk mengestimasi nilai () disebut estimator
() dan nilai amatan statistik t = (x1, x2, , xn) disebut estimasi ().
Jelas bahwa ini termasuk kasus untuk mengestimasi nilai parameternya sendiri, misalkan
()=. Pada definisi 9.1.1, digunakan tiga simbol yang berbeda, huruf (T) menotasikan
statistik yang digunakan sebagai estimator, huruf (t) merupakan nilai amatan atau
estimasinya, huruf() fungsi yg diaplikasikan pada sampel acak. Selain itu pada bab ini juga
akan menggunakan notasi circumflex (yang biasa dibaca topi) sebagai parameter.
Parameter digunakan untuk membedakan antara nilai parameter yang lain dengan
estimatornya.
9.2 Beberapa Metode Estimasi
Metode Momen
Mean sampel( ), yang dijelaskan di Bab 8 bahwa digunakan sebagai estimator dari
mean populasi . Pendekatan umum yang menghasilkan estimator diketahui sebagai Metode
Estimator Momen (MMEs).
Misalkan pdf populasi (
) tergantung pada satu atau lebih parameter
.
dirumuskan :
(
)
( )
(9.2.1)
Definisi 9.2.1
Jika
adalah sampel acak dari (
oleh

),

pertama moment sampel diberikan

(9.2.2)

Seperti yang telah dibahas pada bab 2, momen pertama sebanding dengan rata-rata

, yang berarti bahwa momen pertama dari sampel akan sama dengan sampel rata-rata.
Misalkan kasus sederhana yang parameternya tidak diketahui, dikatakan = . =

52

adalah

estimator yang beralasan


menyelesaikan dalam permasalahan

untuk

mengestimasi =

()

digunakan

untuk

() sebagai estimator dari .

Secara umum, metode momen digunakan sebagai estimator dari parameter


yang membuat momen populasi sama dengan momen sampel, dengan
dengan nilai
adalah solusi dari persamaan :
kata lain,
)
(
(9.2.3)
Contoh 9.2.1:
Misalkan sampel acak dari distribusi dengan dua parameter yang tak diketahui, mean
dan varians
. Diketahui bahwa
,
merupakan metode momen pertama dan
(

dan

) , sehingga MMEs adalah solusi dari persamaan


dan
( ) , dimana

Metode Likelihood
Metode Likelihood adalah suatu metode yang mengarah pada sifat-sifat estimator yang
diinginkan, terutama untuk sampel besar, yaitu dengan menggunakan nilai dalam parameter
yang berhubungan dengan kemungkinan terbesar untuk data pengamatan sebagai perkiraan
dari parameter yang tak dketahui.
Definisi 9.2.2
Fungsi Likelihood Pdf bersama dari n variabel
yang dinilai dengan
,
mengatakan bahwa (
) tertunjuk sebagai fungsi Likelihood. Untuk
yang tetap, fungsi kemungkinannya adalah sebuah fungsi dari dan sering ditulis dengan
( ).
Jika
merepresentasikan sebuah sampel acak dari (
), maka :
( )
(
)
(
)
(9.2.4)
Definisi 9.2.3
(
)
Estimator MaksimumLikelihood.Misalkan ( )
, adalah pdf
), nilai dalam di mana ( )
bersama dari
. Untuk data pengamatan, (
maksimum maka disebut Estimator MaksimumLikelihood(MLE) dari . Yaitu, adalah
nilai dari yang memenuhi :
)
(
)
(
(9.2.5)
Dalam penerapan fungsi likelihood, ( ) merepresentasikan pdf bersama dari sampel acak,
walaupun kemungkinan maksimumnya juga dapat dipakai dalam kasus lain seperti dalam
order statistik. Jika
adalah selang terbuka, dan ( ) dapat diturunkan dan dimisalkan
maksimum pada , maka MLE akan menjadi solusi dari persamaan :
( )

(9.2.6)

Teorema 9.2.1
Sifat Invarian Jika adalah MLE dari

dan jika ( ) adalah sebuah fungsi dari

maka ( ) adalah MLE dari ( ).

53

Contoh 9.2.7
Misalkan sampel acak dari distribusi eksponensial,
sampel berukuran n adalah

( ). Fungsi kemungkinan untuk

( )
Dengan demikian,

( )

( )

persamaan ini disamadengankan nol akan memberikan

(
)
Jika kita ingin mengestimasi ( )
, maka kita tahu dari Teorema 9.2.1

bahwa MLE-nya adalah ( )


Teorema 9.2.2
Sifat Invarian Jika
dari

( ( )

) menunjukkan MLE dari

( )) adalah

( ( )

), maka MLE

( )) untuk

Estimator dengan banyak parameter akan tidak sama seperti estimator tunggal ketika
parameter yang lain diketahui.
Contoh 9.2.11
Misalkan sampel acak dari distribusi dengan dua parameter tidak diketahui,
(
).
Pdf populasinya adalah
(

( )

Fungi kemungkinannya adalah


(

( )

dan kemungkinannya dalam log adalah


(

dimana
adalah minimum dari
. Kemungkinannya dimaksimalkan dengan
mengikuti dengan mengambil
. Untuk memaksimalkan secara relative ke , bisa
diturunkan ( ) dengan mengikuti , dan menangani persamaan
( )
(
)

dengan hasilnya

Persentil dari , , sedemikian hingga


(
dan MLE dari
adalah

)
)

54

diberikan oleh
seperti pada Teorema 9.2.2.

9.3 Kriteria Untuk Menilai Estimator


Beberapa sifat dari estimator sebagai berikut :
Estimator Unbiased
Definisi 9.3.1
Estimator unbiased. Suatu estimator T dikatakan estimatorunbiased () jika memenuhi:
E(T) = ()
(9.3.1)
Untuk semua . Jika syarat tersebut tidak dipenuhi maka dikatakan T adalah sebuah
estimator biased dari ().
Contoh 9.3.1
Diberikan sampel populasi berdistribusi normal dengan mean tidak diketahui, dan variance
Interval parameter = (-, ), nilai tengah (mean) dari distribusi normal, - < <
.Akan diestimasi dengan 95% percentil, dalam distribusi N(,9). Contoh berikut ini dalam
sebuah fungsi dari parameter,
Karena, ( )
.
( ),
Dengan estimator obyektif T = +4.95 adalah estimator unbias dari
E(T) = E( +4.95) = E( )+4.95 = + 4.95, dengan tidak memperdulikan nilai dari . Hal
tersebut menunjukkan bahwa estimator unbiased memungkinkan untuk dijadikan estimator
biased.
Gambar 9.2

Jika T adalah estimator unbiased dari (), berdasarkan pertidaksamaan chebychev bahwa
[ ( )
( )
]
( )
(9.3.3)
Untuk semua
. ini menunjukkan bahwa untuk estimator unbiased, satu dengan varians
yang lebih kecil akan cenderung lebih terkonsentrasi dan dengan demikian mungkin lebih
baik.
Uniformly Minimum Variance Unbiased Estimators (UMVUE)
Definisi 9.3.2
Diberikan

adalah sampel acak berukuran n dari ( ). Sebuah taksiran T* dari

() dinamakan (UMVUE) dari (), jika :


1. T* adalah obyektif untuk () dan
2. Untuk taksiran obyektif lainnya T dari (), Var(T*) Var (T) untuk semua

55

Contoh 9.3.4
Misalkan sampel acak dari sebuah distribusi eksponen,
( )

Pdf

)=

ln (

) = ln

ln (

)=

ln

(
[

)]

[(

( ) karena

)
)

Teorema 9.3.1
Jika sebuah estimasi yang unbiaseduntuk () ada, variansi yang memenuhi CRLB,maka
hanya sebuah fungsi linear() yang dapat dipakai sebagaiestimasiunbiased variannya
memenuhi hubungan CRLB.
Definisi 9.3.3
Efisiensi. Suatu efisiensi relatif dari estimatorunbias T untuk () diberikan oleh
(

(9.3.7)

( )

)
Suatu estimator unbias T* untuk() dapat dikatakan efisien jika (
untuk semua
estimator unbias T dari (), dan semua . Efisiensi dari suatu estimatorunbias T untuk
() diberikan dengan :
( )
(
)
(9.3.8)
*
Jika T adalah suatu estimator efisien untuk()
Definisi 9.3.4
Jika T adalah sebuah estimatoruntuk (), maka bias adalah
b(T) = E(T) - ()

(9.3.9)

dan mean squared error (MSE) dari T adalah


MSE(T) = E[T - ()]2

(9.3.10)

Teorema 9.3.2
Jika T adalah taksiran dari (), maka
MSE(T) = Var(T) + [b(T)]2

(9.3.11)

56

Bukti :
( )

[
[
[

( )]
( )
( )
( )]
( )]
[ ( )
( )]
[ ( )
( )] [ ( )
( )]
( ) [ ( )]
Kesalahan hasil kali rata-rata (MSE) adalah sebuah standar yang dapat beralasan dengan
memperhatikan antara varians dan estimaunbiased.
9.4 Sifat-sifat untuk Sampel Besar
Definisi 9.4.1
Konsistensi Sederhana
Misalkan { } suatu barisan estimator ( ) ,estimator dikatakan estimator konsisten untuk
( )jika setiap
( )|
[|
]
, untuk setiap

(9.4.1)
Definisi 9.4.2
Konsistensi MSE
Jika { } merupakan suatu barisan estimator ( ), dapat dinamakan mean squared error
konsisten dimana
[

( )]

, untuk setiap

(9.4.2)

Definisi 9.4.3
Asimtotik Unbiased
Suatu barisan { } merupakan asimtotik unbiased ( ) jika
( )

( ), untuk semua

(9.4.3)

Teorema 9.4.1
Suatu barisan { } merupakan konsisten MSE jika dan hanya jika unbiased asimtotik dan
( )
Bukti :
Berhubungan dengan teorema 9.3.2
( )
( ) [ ( )
( )]
Karena keduanya menunjukkan bagian kanan tidak negatif,
( )
( ).
langsung
dan ( )

57

( )

secara tidak

Contoh 9.4.1:
Pada contoh 9.3.2, misalkan perbandingan terbalik dari mean sampel, dengan
merupakan estimator ( )
, pada catatan sebelumnya
(
persamaan 8.3.6 diperoleh ( )
sehingga ( )

](

( )

dan

( )

) dan

karena

[(

). Dari
],

Teorema 9.4.2
Jika suatu barisan { } merupakan

MSE konsisten maka juga merupakan konsisten

sederhana
Bukti :
Dari ketidaksamaan Markov,
[|
( )|
]

( )
dan
sehingga
mendekati 1 karena

( )

Teorema 9.4.3
Jika { } adalah konsisten sederhana dari ( ) dan jika ( )yaitu nilai kontinu lain ( ),
maka ( ) adalah konsisten sederhana dari ( ( ))
Definisi 9.4.4
Asymptotic Efficiency
{ } dan { } merupakan dua asimtotik unbiased barisan estimator ( ). Maka asimtotik
relative efisien (are) diperoleh dari
(

(9.4.4)

(
)
urutan { } merupakan asymptotic efficiency jika
untuk semua urutan
asimtotik unbiased { } lain, dan semua
. asymptotic efficiency dari urutan asimtotik
( )
(
) jika { } asymptotic efficiency.
unbiased{ } diperoleh dari
Contoh 9.4.3:
Dari contoh 9.4.1 terdapat
( ), urutan
ditunjukkan asimtotik objektif untuk
( )

. Varian adalah

[(
[

Karena

[(

] dan CRLB adalah

[ (

)]

]
)

merupakan efisien asimtotik untuk mengestimasi 1/ .


Sifat-sifat Asimtotik dari MLE
Jika memenuhi kondisi tertentu, maka penyelesaian persamaan MLE mempunyai sifat :
1. ada dan tunggal
2. merupakan estimator konsisten dari
3. merupakan normal asimtotik dengan mean asimtotik
dan varian
[

)]

58

4. merupakan asimtotik efisien


Contoh 9.4.7 :
Misalkan sampel acak dari distribusi pareto
(
)
(
selanjutnya

) dimana k tidak diketahui. Karena

( )

) (

Dan persamaan ML adalah


( )

Didapat MLE

Untuk mencari CRLB


(

(
(

) (

)
)

Sehingga
[

)]

Untuk mengevaluasi persamaan diatas dimisalkan dengan transformasi


(
)
(
)
Sehingga
[ (
)]
[

[ (

)]
( )

)]

9.5 Estimator Bayes dan Minimax


Ketika estimasi berbeda dari nilai kebenaran dengan parameter yang diestimasi, Sesuatu
dapat mempertimbangkan hilangnya fungsi dari perbedaan ini. Jika diasumsikan bahwa
peningkatan dengan kuadrat dari perbedaan, maka kriteria MSE hanya menganggap
hilangnya kesalahan rata rata kuadrat yang terkait dengan kriteria MSE estimator.
Definisi 9.5.1
Loss Function
Jika T merupakan estimator ( ), maka Loss function adalah fungsi sembarang nilai real,
(

untuk setiap t, dan

saat

(9.5.1)

( ).

(9.5.2)

59

Definisi 9.5.2
Risk Function
Risk Function didefinisikan menjadi
[ (

( )

)]

(9.5.3)

Jika suatu parameter atau fungsi dari parameter akan diestimasi, dapat dipilih loss function
yang bergantung dengan masalah tersebut, dan ketika mencoba untuk menemukan estimator,
risk function dari keduanya adalah kecil untuk semua nilai parameter kemungkinan.
Definisi 9.5.3
Admissible Estimator
Sebuah estimator lebih baik daripada estimator jika dan hanya jika :
( )
( ) untuk semua
, dan
( )
( ) untuk terakhir
Sebuah estimator T merupakan Admissible estimator jika dan hanya jika tidak ada estimator
yang lebih baik.
Definisi 9.5.4
Minimax Estimator
Suatu estimator

( )

merupakan minimax estimator jika :

( ) untuk setiap estimator T

(9.5.4)

( )

( ). Maksimum dan minimum dapat diganti dengan konsep


general dari batas atas terkecil dan batas bawah terbesar.
Definisi 9.5.6
Bayes estimator
Untuk sampel acak (
), bayes estimator
relative untuk fungsi resiko
dan pdf ( ) adalah estimator dengan perkiraan resiko minimum,
[ ( )]
[ ( )] untuk setiap estimator
Definisi 9.5.7
Distribusi Posterior
Kepadatan bersyarat diberikan pengamatan sampel
Posterior atau pdf posterior, dan diberikan oleh
|

( )

(
(

| ) ( )
| ) ( )

( )
(9.5.7)

) dinamakan kepadatan
(9.5.8)

60

Teorema 9.5.1
merupakan sampel acak ( | ) maka Estimator bayes adalah estimator yang

Jika

meminimalisir kerugian relative nilai harapan distribusi posterior | diberikan oleh


[ (

)]

Teorema 9.5.2
Estimator Bayes T dari ( ) di bawah fungsi kuadrat error kerugian,
(

( )]

(9.5.10)

Adalah mean bersyarat relative ( ) untuk distribusi posterior


|

[ (

)]

( )

( )

(9.5.11)

Contoh 9.5.4:
Misalkan sampel acak berukuran n dari distribusi Bernoulli
Contoh 9.5.4
Berdasarkan sample acak berukuran n dari distribusi bernaulli
( | )
(
)
Dan
( ). Persamaan kepadatan posteriornya

(
)
(
)
|
)
(
Untuk menunjukkannya menggunakan notasi distribusi beta. Variabel acak Y dari distribusi
(
)
beta dengan parameter a dan b,
)
(
)
Pdfnya (
(
) dimana 0 < y < 1 dan y yang lain 0, dengan
(
)
( ) ( ) (
). ( )
(
).
Untuk menunjukkan distribusi posterior,
(

Dengan kata lain,


Oleh karena itu

( )

) (

Kuadrat error kerugian estimator Bayes

(9.5.12)

).
(
)]

[(

( )

adalah

)
)
(
(

)
)

Teorema 9.5.3
Estimator Bayes dari
(

dibawah error kerugian absolute

Adalah median dari distribusi posterior

(9.5.14)
|

( )

61

Teorema 9.5.4
( )

Jika T* suatu estimator bayes dengan resiko konstan,

maka T* estimator

minimax
Bukti :
Misalkan

( ), tapi karena
( ) konstanta atas ,
( )
[ ( )]
[ ( )]
Untuk setiap T karena T* estimator bayes. Rata-rata dari suatu variable tidak lebih besar dari
nilai maximum variable itu sendiri.
( ) dan
( )
( )
Jadi [ ( )]
Dimana T* adalah estimator minimax.
Contoh 9.5.6 :
Berhubungan dengan distribusi prior dan posterior dalam contoh 9.5.4, disini kita mencari
bobot kuadrat error kerugian,
(

( )

)
(

(9.5.15)

)
|

[ (

)]

)
(

) (

( ) (

Dengan ( )
(
Yang mana mean

[ (

(
(
(

) (
)
)] minimal saat integral yang terakhir minimal. Integral ini

cocok untuk kondisi biasa ekspektasi kuadrat error kerugian (


) relatif untuk distribusi
). Dengan teorema 9.5.2, integral ini minimal saat t adalah
posterior
(
). Berarti

)
mean dari
(
(
.
.
( )
Dimana
dan
estimator
bayes
adalah
Resikonya
[
]
(
)
( )
(
)
(
)
SOAL-SOAL LATIHAN
1.

Tentukan MME dari


(
)
Penyelesaian :
(
)
( )

yang bergantung pada sampel acak


dan 0 untuk yang lain,

62

dengan

]
( )

( )

Jadi MME dari


2.

adalah

Dapatkan MME dari sampel random berukuran n dari distribusi


Penyelesaian :
a. ( )
b.

) dengan

Jadi MME dari


3.

) adalah

Dapatkan MME dari sampel random berukuran n dari distribusi


dan tidak diketahui
Penyelesaian :
a. ( )
( )

( )
( )

b.

Persamaan a = b

63

4.

) adalah

Jadi MME dari

Dapatkan MME dari sampel random berukuran n dari distribusi


Penyelesaian :
1.

( )

3. ( )

= =

2.

( )

p=

E(x) =

5.

Dapatkan MME dari sampel random berukuran n dari distribusi

Penyelesaian :
1.

( )

2.
3. ( )

( )

( )

( )

( )

6.

Dapatkan MME dari sampel random berukuran n dari distribusi


tidak diketahui
Penyelesaian :
( )
1.
2.

64

) dengan

3. (1) = (2)

Var (x) =

-(

MME dari
(
)
7. Misalkan sampel acak dari distribusi eksponensial,
untuk sampel berukuran n adalah

( ). Fungsi kemungkinan

( )
Dengan demikian,

( )

( )

Menyamakan persamaan ini ke nol akan memberikan


Jika kita ingin

(
)
mengestimasi ( )
, maka kita tahu dari Teorema 9.2.1 bahwa

MLE-nya adalah ( )
(

8. Misalkan sampel acak dari distribusi pareto


Karena
(
)
(
)
selanjutnya
( )

) dimana k tidak diketahui.

) (

Dan persamaan ML adalah


( )

Didapat MLE

Untuk mencari CRLB


(

(
(

) (
(

Sehingga

65

)
)

)]

Untuk mengevaluasi persamaan diatas dimisalkan dengan transformasi


(
)
(
)
Sehingga
[ (
)]
[

[ (

)]

)]

( )

(
)
9. Diberikan populasi berdistribusi normal dengan mean tidak diketahui, namun variance
Interval parameter tepat adalah = (-, ), karena pada umumnya nilai tengah
(mean) dari distribusi normal, - < < . Dengan keinginan untuk menaksir 95%
bagian, dalam distribusi N(,9). Contoh berikut ini dalam sebuah fungsi dari parameter,
karena ( )
. diikuti dengan T= + 4.95 adalah estimator
obyektif dari ( ), karena E(T) = E( + 4.95) = E( ) + 4.95 = + 4.95, dengan tidak
memperdulikan nilai dari .
10. Dari contoh sebelumnya terdapat
( ), urutan
ditunjukkan asimtotik
objektif untuk
[

[ (

)]

( )

. Varian adalah
]Karena

[(
[

[(

merupakan efisien asimtotik untuk mengestimasi 1/ .

66

] dan CRLB adalah

]
)

BAB X
KECUKUPAN DAN KELENGKAPAN
10.1 PENDAHULUAN
Pada Bab 9 dibahas mengenai penentuan estimasi titik dengan menggunakan sampel
acak untuk mengestimasi parameter yang tidak diketahui pada populasi. Pada beberapa kasus,
hal itu mungkin dapat ditunjukkan bahwa suatu bagian statistik atau himpunan dari statistik
terdiri atas informasi pada sampel tentang parameter. Hal tersebut menjadi alasan
pembatasan statistik ketika mengestimasi atau untuk melakukan inferensi tentang parameter.
Jadi informasi dalam suatu sampel
akan digunakan untuk melakukan inferensi
tentang parameter.
Pada umumnya istilah dari kecukupan meliputi reduksi suatu himpunan data atau
ringkasan data dari statistik dengan tidak ada informasi yang diketahui dari parameter. Suatu
statistik dinyatakan sebagai suatu sufficient/kecukupan statistik untuk suatu parameter
jika distribusi bersyarat dari statistik yang lain diberikan nilai dengan tidak diketahui .
Dengan kata lain, nilai awal dari suatu statistik kecukupan diketahui, nilai amatannya dari
statistik yang lain termuat informasi yang lain tentang parameter.
Contoh Soal 10.1.1
Sebuah koin dilempar sebanyak kali dan hasil kejadian diamati untuk setiap lemparannya.
Serta dimodelkan dalam sebuah sampel acak
masing-masing berdistribusi
Bernoulli. Dimisalkan tidak diketahui kondisi koin seluruhnya. Tentukan estimasi
(
) Hal itu terlihat merupakan jumlah keseluruhan muka yang muncul yaitu
,
memberikan banyak informasi tentang nilai
sebagai hasil
sebenarnya.
Penyelesaian:

(
)
(
) dengan
(
) sehingga pdf marginal
Diketahui bahwa
(

( )

Jika
maka kejadiaannya [
ekuivalen,dan
|

] dan [
[

]
[

)
(

( )

]
(

)
(

( )

Jika
misalkan
{(
|

( )

maka pdfnya 0. Pada kasus lain, hal itu tidak melibatkan . Selanjutnya
(
)
untuk
statistik
lain
dan
didefinisikan
) (
)
} Pdf bersyarat dari
diberikan
yaitu:
[

) yang mana juga tidak memuat

67

10.2 STATISTIK KECUKUPAN


Pada bab sebelumnya, suatu himpunan data
akan dimodelkan
matematika sebagai nilai pengamatan dari suatu peubah acak
. Untuk
memudahkan
penulisan
digunakan
notasi
vektor,
(
)
dan
(
) nilai kemungkinannya. Dan juga mengikuti kemungkinan dari suatu
vektor-nilai parameter dan vektor nilai statistik dan .
Definisi 10.2.1
Statistik Kecukupan Bersama
(
) dan
Andaikan
(
) merupakan pdf bersama dari
(
) dengan k-dimensi statistik. Kemudian
adalah suatu himpunan
statistik kecukupan bersama untuk jika vektor statistik yang lainnya pdf bersyarat dari
diberikan
dinotasikan | ( ) tidak bergantung pada . Pada kasus dimensi satu,
dikatakan adalah statistik kecukupan bersama untuk
Bila teramati, penambahan informasi tentang tidak dapat diberikan dari jika
distribusi bersyarat diberikan
adalah bebas . Diasumsikan bahwa
) dan untuk
adalah suatu sampel acak dari sebuah populasi dengan pdf (
memudahkannya sering digunakan vektor
(
) sebagai sampel acak.
Umumnya merupakan vektor lain pada pengamatan peubah acak, seperti sampel sensor
atau himpunan lain dari order statistik.
Tujuan utamanya adalah untuk mereduksi sampel menjadi himpunan terkecil dari
statistik kecukupan atau dapat diartikan sebagai himpunan minimal dari statistik
kecukupan. Jika
parameter tidak diketahui pada model, maka sering terdapat suatu
himpunan dari statistik kecukupan. Pada beberapa kasus, jumlah statistik kecukupan akan
melebihi jumlah parameter dan pada beberapa kasus tidak ada reduksi pada jumlah statistik
yang mungkin.
Definisi 10.2.2
Suatu himpunan dari statistik dikatakan himpunan minimal kecukupan jika anggota dari
himpunan kecukupan bersama untuk parameter dan jika merupakan sebuah fungsi pada
setiap himpunan lain statistik kecukupan bersama.
Untuk contohnya, order statistik akan ditunjukkan menjadi statistik kecukupan
bersama. Pada kasus tersebut menunjukkan suatu reduksi dari sampel, walaupun jumlah dari
statistik pada kasus tersebut tidak tereduksi. Pada beberapa kasus, order statistik mungkin
menjadi himpunan minimal kecukupan statistik, tetapi tentunya diharapkan bisa mereduksi
sampel menjadi suatu jumlah terkecil dari statistik kecukupan bersama.
Terlihat jelas bahwa satu dari semua kemungkinan statistik tidak diketahui dan
digunakan definisi 10.2.1 untuk memeriksa bahwa adalah suatu statistik kecukupan. Karena
bisa ditulis menjadi suatu fungsi dari sampel
(
), satu kemungkinannya

68

akan ditunjukkan bahwa | ( ) adalah bebas dari


Sesuai pada contoh 10.1.1, dengan
merupakan suatu sampel acak dari distribusi Bernoulli. Bahwa asal mulanya yang sama dapat
digunakan pada banyak situasi yang umum dengan adalah diskrit dan dan adalah nilai
vektor. Andaikan bahwa
(
) dimana
(
) untuk
) Dan analog dengan contoh 10.1.1, kondisi
dan dinotasikan dengan (
(

pdfnya dari
|

) diberikan
(
{
(
)

dan ditulis sebagai :


)

Contoh 10.2.1
Andaikan sampel acak dari suatu distribusi eksponensial,
untuk
Penyelesaian:
Pdf tunggal
( )

( ). Tentukan estimasi

Pdf bersama dari sampel acak


(
misalkan

maka

)
) sehingga pdfnya,

( )
(

)
(

S berdistribusi Gamma,
(

Jika s=

( )

( )
( )

artinya pdf bersyarat tidak tergantung pada


merupakan statistik kecukupan untuk

kemudian menurut persamaaan (10.2.1)

Suatu kriteria penyederhanaan didapat sebagai berikut. Khususnya, jika


adalah statistik kecukupan bersama untuk , maka
(
)
(
) |(
)
(
) (
)
(
)
pdf bersama untuk sampel dapat difaktorkan kedalam suatu fungsi dari dan dari
)
(
) yang tidak melibatkan
Sebaliknya andaikan bahwa (
(
) (
) dengan asumsi bahwa untuk
) tidak
tetap, (
tergantung pada . Artinya jika pdf bersama dari
nol, beberapa bagian dari
maka harus diidentifikasi pada bagian hubungan dari dan , dan pada hubungan dan
sebaliknya melibatkan x dengan . Jika hal tersebut tidak mungkin, maka pdf bersama benarbenar tidak sepenuhnya tetap pada bentuk keadaannya. Pada dasarnya, jika persamaan
(10.2.2) beberapa fungsi
dan , maka pdf marginalnya dari dapat dinyatakan dalam
bentuk

69

(
)

Sehingga menjadi (
Atau

)
(

)
(

( ) ( )
) (

) ( )

) ( ) yang mana tidak bergantung pada

. Hal ini

menunjukkan sebagai bukti pada teorema di bawah ini.


Teorema 10.2.1
Kriteria Faktorisasi
) dan jika
Jika
mempunyai pdf bersama (
(
) maka
adalah statistik kecukupan bersama untuk
hanya jika
(
)
(
) (
)
(
(
) tidak bergantung pada
, kecuali melalui , dan (
bergantung

jika dan
) dengan
) tidak

Contoh 10.2.2
Berdasarkan sampel acak
pada contoh 10.1.1, dengan
(
). Sebagai contoh

misalkan
sebagai statistik kecukupan dan secara langsung dengan pdf bersyarat
untuk yang diberikan
. Digunakan kriteria faktorisasi untuk menyederhanakan sampel
acak tersebut

(
)
(
)
(
)
(
) (
)

)
Untuk
dan pada kasus ini, didefinisikan (
jika semua
atau 1, dan 0 untuk yang lain. Hal tersebut dinotasikan proporsi sampel,
juga
statistik kecukupan untuk Pada umumnya, jika suatu statistik dikatakan kecukupan untuk
maka fungsi satu-satu dari juga kecukupan untuk
Contoh 10.2.3
Andaikan sampel acak berdistribusi uniform,
(
) dengan
diketahui. Gunakan kriteria faktorisasi untuk menyederhanakan sampel acak tersebut!
Penyelesaian:
Pdf bersama untuk
adalah
(

Hal tersebut akan lebih mudah jika dituliskan dalam orde statistik minimum
maksimum
dari
.
Sehingga (
yang artinya bahwa (

tidak

)
)

) (

70

).

dan

Dengan

dan 0 untuk yang lainnya, dan (

jika

jika

dan 0 untuk yang lainnya. Hal tersebut dari bentuk kriteria faktorisasi bahwa order
statistik terbesar
statistik kecukupan untuk
Definisi 10.2.3
Jika
adalah suatu himpunan, maka fungsi indikator dari
didefinisikan sebagai
( )

( )

)(

)(

)(

( )

)(

persamaan (10.2.3)

) dan (

Contoh 10.2.4
Diberikan suatu sampel acak dari suatu distribusi normal,
tidak diketahui.
Penyelesaian:
Pdf bersama dari distribusi normal diberikan oleh
(

)(

)
misalkan

dan

dan

dan

) ]

Catatan juga bahwa MLE,

) dengan

[
(
(
)
)
Dan (
Maka dengan kriteria faktorisasi,
(
)
statistik kecukupan bersama untuk

pemetaan satu-satu dari


bersama untuk dan

[
(

Karena (

jika dan hanya jika


(

dan dengan

) maka

) sehingga bahwa
(

Karena

Pada contoh sebelumnya, jika dimisalkan


(

, dinotasikan dengan

,
)]

dan
(

adalah

) , merupakan

, sehingga dan juga merupakan statistik kecukupan

10.3 SIFAT-SIFAT STATISTIK KECUKUPAN


Teorema 10.3.1
Jika , ,
adalah kecukupan bersama untuk
maka merupakan fungsi dari =( , , ).

71

dan MLE tunggal dari ,

Bukti:
Dari kriteria faktorisasi,
( ,,
)
) ( ,, )
(10.2.3)
yang merupakan nilai fungsi maksimum likelihood yang bergantung pada s,
MLE tunggal maka menyatakan fungsi dari s.
( )
(

Contoh 10.3.1
Diberikan
diskrit dengan pdf
indikator
(

)(

) dan

Jika ( )
( )( )
( )( )
dilihat dengan kriteria faktorisasi
( )

)(

( )

( )(

) maka

( )(

( ) kecukupan untuk

, dapat

s (ada lebih dari satu MLE)

) menghasilkan MLE,

)(

) dan (

={0,1}, maka dengan menggunakan fungsi


)

( )(

( ) Jika

( )

) menghasilkan MLE,
( )
ini sesuai dengan estimasi maksimum (
) untuk menetapkan setiap .
bukan fungsi S karena ( )
( )
( )
, ( )

( )
( ), ( )
sehingga ( )
( )( )
( )

)(

Teorema 10.3.2
Jika S kecukupan untuk

maka setiap estimator Bayes menjadi fungsi S.

Bukti:
Fungsi ( , , ) pada kriteria faktorisasi tidak bergantung pada , sehingga persamaan
9.5.8 Posterior density
| ) ( )
(
| ( )
| ) ( ) ( )
(
(
(

) ( )
) ( ) ( )

Telah disebutkan sebelumnya bahwa order statistiknya adalah kecukupan bersama.


Teorema 10.3.3
Untuk mendapatkan
,,
dan terkait , ,
Jika , ,
sampel acak distribusi kontinu dengan pdf (
bentuk order statistiknya himpunan kecukupan bersama untuk .
Bukti:
Untuk mencari
(
(

(
)

,,
)

), maka

dan nol untuk yang lain

72

Secara umum, statistik kecukupan melibatkan UMVUE.


Teorema 10.3.4
Rao-Blackwell.
,,
memiliki pdf bersama (
) dan =( , , ) statistik
kecukupan bersama untuk . Jika T estimator unbias dari ( ) dan jika
T*= ( | ), maka
1. T* estimator unbias dari ( )
2. T* fungsi dari S
3. Var (T*) Var (T) untuk semua dan
Var (T*)
Var (T) untuk beberapa
kecuali jika T*=T dengan
probablitas 1.
Statistik kecukupan, | ( ) tidak bergantung
dan *( )
( | ) estimator fungsi S,
didapat
( *)
( *)
= [ ( | )]
= ( )
(teorema 5.4.1)
= ( )
(persamaan 9.3.1)
Var(T) = Var[ ( | )] + [ ar( | )] (teorema 5.4.3)
Var[ ( | )]
= Var(T*)
Jika dan hanya jika [ ar( | )] = 0, yang mana terjadi jika dan hanya jika ar( | ) = 0
dengan probabilitas 1 atau ekivalen dengan T= ( | ) = T*.
10.4 KELENGKAPAN DAN KELAS EKSPONENSIAL
Definisi 10.4.1
Kelengkapan.
Sebuah keluarga dari pdf { (
untuk semua
maka ( )

)
}, disebut lengkap jika [ ( )]
dengan probabilitas 1 untuk semua
.

Terkadang ditunjukkan dengan tidak adanya estimator unbias nontrivial dari nol.
Maksudnya 2 fungsi berbeda dari T tidak dapat memiliki nilai ekspektasi yang sama. Sebagai
contoh :
[ ( )]
( )
dan
[ ( )]
( ), maka
[ ( )
( )]
( )
( )
( )
( )
dengan probabilitas 1, jika keluarga pdf lengkap. Untuk keadaan ini estimator unbias tunggal.

73

Syarat keluarga pdf statistika kecukupan lengkap :


1. Fungsi unbias dari statistik kecukupan harus tunggal
2. Ada UMVUE oleh teorema Rao-Blackwell.
Statistik kecukupan dengan pdf yang anggota keluarganya lengkap disebut statistik
kecukupan lengkap.
Teorema 10.4.1
Lehmann-Scheffe. , ,
memiliki pdf bersama (
) dan
statistik kecukupan lengkap untuk . Jika T*= *( ) merupakan statistik
unbias untuk ( ) dan fungsi , maka T* adalah UMVUE dari ( )
Bukti:
Fungsi dan estimator unbias ( ) pasti sama dengan T* dengan probabilitas 1. Jika T order
statistik dengan estimator unbias ( ), maka dari teorema Rao-Blackwell ( | ) juga unbias
untuk ( ) dan fungsi , jadi dengan ketunggalan, T*= ( | ) dengan probabilitas 1.
Selanjutnya, Var (T*) Var (T) untuk semua . Dengan begitu T* adalah UMVUE dari ( )
Contoh 10.4.1
Diberikan , ,
Pdf :

dengan kriteria faktorisasi,


dengan

merupakan statistik kecukupan.


( )
, sehingga fungsi ( )
[ ( )]

( ) (

Karena
maka ( )

( ),

sampel acak dari distribusi Poisson,

, agar

[ ( )]

( )

untuk setiap koefisien

. Dengan kelengkapan,

maka dari teorema 10.4.1 jelas bahwa

fungsi tunggal

( )

harus nol. Jika


dan unbias untuk

adalah UMVUE dari .

74

( )

( )

Definisi 10.4.2
Kelas Eksponensial.
Suatu pdf dikatakan Regular Exponential Class (REC) jika dapat dinyatakan
dalam bentuk
(
)
( ) ( )
( ) ( )]
[
(10.4.1)
Dan nol untuk yang lain, dimana
(
) vektor dari parameter tidak
diketahui-k, jika parameter ruang dalam bentuk
{ |
}
(
dan
), dan jika memenuhi:
1. Himpunan
{
(
)
} tidak bergantung pada
2. Fungsi ( ) nontrivial, independen, kontinu dari
3a. Untuk variabel acak kontinu, turunan
( ) tidak bergantung secara
linear pada atas
3b. Untuk variabel acak diskrit, ( ) nontrivial pada atas , dan tidak
ada fungsi linear yang lain.

) anggota dari REC (

) atau REC sederhana.

Contoh 10.4.2
Suatu distribusi Bernoulli,

)
(

)
(

Dari definisi diperoleh : REC( ) dengan

( )

[
[

]}

( )
Teorema 10.4.2
Jika

,,

) maka

sampel acak dari anggota REC(

( )

( )

Merupakan statistik kecukupan lengkap minimum untuk

Contoh 10.4.3
( ). Untuk sampel acak n, ( )
Pada contoh 10.4.2,

merupakan statistik kecukupan lengkap untuk


Var( )
(
)

Coba (
)
)]
[ (
( )
( )

75

dan
. Maka UMVUE dengan

[ (

)]
[ (

( )
)]

[ (

)]

[ (

)]

[ (
[ (

) (
[

UMVUE dari (

(
(

)(

)]

) adalah (

( )]
( )
)

)(

)]

(
(

[ ( )
(

) dimana

Contoh 10.4.4
(
), maka
Jika
(

]
]

Untuk sampel acak ,


dan
adalah lengkap bersama dan statistik
kecukupan dari dan . Karena MLE fungsi satu-satu dari
dan
maka bisa digunakan
pada statistik kecukupan lengkap bersama ini.
Teorema 10.4.3
Jika T suatu estimator CRLB ada untuk ( ), maka statistik kecukupan
tunggal ada dan T fungsi statistik kecukupan. Sebaliknya, jika statistik
kecukupan tunggal ada dan CRLB ada maka ada suatu estimator CRLB untuk
beberapa ( ).

Teorema 10.4.4
Jika CRLB ada, maka ada suatu estimator CRLB untuk beberapa ( ) jika dan
hanya jika pdf anggota REC. Selanjutnya, estimator CRLB dari ( ) menjadi
( ), dimana merupakan MLE dari .

Definisi 10.4.3
Suatu pdf dikatakan anggota Range-Dependent Exponential Class
(RDEC)(
) jika memenuhi kondisi 2 dan 3a atau 3b dari definisi
10.4.2 untuk
dan jika dalam bentuk
(
)
( ) ( )
(
) ( )]
[
(10.4.2)
dimana
{ | (
)
(
)} dan
76

Keadaan khusus meliputi


)
( ) ( ) dengan
1. Keadaan satu parameter, dimana (
{ | ( )
( )}
)
(
) ( ) dengan
2. Keadaan dua parameter, dimana (
{ | (
)
(
)}
Teorema 10.4.5
Diberikan , ,
sampel acak dari anggota RDEC(
).
1. Jika
, maka
,
dan
dimana

( ) adalah kecukupan bersama untuk


(
)
2. Keadaan dua parameter,
dan
merupakan kecukupan
bersama untuk
(
)
3. Keadaan satu parameter,
dan
merupakan kecukupan
bersama untuk .
Jika ( ) naik dan ( ) turun, maka
[
(
)
(
)] statistik kecukupan tunggal untuk .
Jika ( ) turun dan ( ) naik, maka
[
(
)
(
)] statistik kecukupan tunggal untuk .

Contoh 10.4.5
Diberikan pdf (

( )
, fungsi turun untuk
( )
, fungsi naik untuk
dari teorema 10.4.5 didapat
[ (

)(

[
(
)
(
)]
)] adalah statistik kecukupan tunggal untuk .

Teorema 10.4.6
Diberikan , ,
sampel acak dari anggota RDEC
1. Jika
dan batas bawah konstan, ( )
, maka

( ) adalah kecukupan bersama untuk dan

dan
.

( )
Jika batas atas konstan,
, maka
dan
( )
adalah kecukupan bersama untuk dan
.
2. Keadaan satu parameter, jika ( ) tidak bergantung pada maka
kecukupan untuk , dan jika ( ) tidak bergantung pada
maka
kecukupan untuk .

77

Contoh 10.4.6
Distribusi eksponensial dengan 2 parameter,
(
(

( )

( )

( )

( )

;
(

Jika , ,
sampel acak
dari teorema 10.4.6 bahwa
dan adalah statistik kecukupan untuk (
bukan fungsi parameter, jadi
tidak terlibat.
Jika diketahui,
, maka
(

( )

( )

).

( )

;
;

kecukupan untuk .
Konsisten dengan hasil sebelumnya, dimana didapat estimator
dari estimator atas statistik lain seperti .

atas

yang lebih baik

Teorema 10.4.7
Basu.
Andaikan
, ,
mempunyai pdf bersama ( , ,
);
.
Dimisalkan =( , , ) dimana , ,
adalah kecukupan bersama
untuk , dan statistik lain. Jika distribusi tidak memuat , maka dan
stokastik independen.

Bukti :
) dan ( | ) adalah pdf dari
Untuk keadaan diskrit, dinotasikan ( ) (
bersyarat terhadap
. Nilai ekspektasi relative terhadap distribusi .
[ ( )

( | )]
( )

( )

( | ) (

, , dan pdf

(
)
( )
( )

Karena statistik kecukupan lengkap, ( | )


independen.
Dengan cara yang sama untuk kasus kontinu

( ) yang meannya

78

dan

adalah stokastik

Contoh 10.4.9
Diberikan sampel acak berukuran n dari distribusi Normal,
(

dan

, dari persamaan 8.3.15 maka


(
)
(
)

(
(

ke persamaan diatas

(
(

substitusikan persamaan 8.2.7 yaitu


)

) dan MLE,

. Mudah untuk membuktikan bahwa statistik kecukupan lengkap untuk

. Untuk menetapkan nilai dari

(
(

)
)

) yang tidak bergantung pada .

dan variabel acak independen.


dan statistik kecukupan dan kelengkapan bersama untuk
Jumlah dari bentuk

dan .

adalah distribusi independen terhadap

dan , jadi jumlah

stokastik independen terhadap dan


RINGKASAN :
Pada bab ini dijelaskan mengenai konsep kecukupan dan kelengkapan. Jika statistik
adalah kecukupan, maka memuat semua informasi dalam data terhadap parameter yang
tidak diketahui dari distribusi. Jika sebuah statistik adalah kecukupan dan MLE tunggal ada,
maka MLE adalah fungsi statistik kecukupan. Statistik kecukupan juga penting dalam
konstruksi UMVUE. Jika statistik lengkap sebaik kecukupan untuk sebuah parameter, dan
jika estimator unbias dari parameter ada, maka UMVUE ada dan merupakan fungsi statistik
kecukupan lengkap. Kadang sulit untuk dibuktikan kelengkapan secara langsung dari definisi,
tetapi sebuah kelas khusus dari pdf, kelas eksponensial, memberikan cara tepat untuk
memperkenalkan statistik kecukupan lengkap.
SOAL-SOAL LATIHAN
( ) Tunjukkan
adalah sampel acak berdistribusi Poisson,
adalah statistik kecukupan untuk ! (Petunjuk : Gunakan persamaan

1. Diberikan

bahwa
10.2.1)
Penyelesaian :

Pdf dari distribusi Poisson yaitu : ( )


Sedangkan pdf bersama untuk distribusi Poisson yaitu :
(

79

Diketahui bahwa
(

maka diperoleh

Jika

maka

)
(

Sedangkan 0 untuk yang lainnya. Karena pdf tersebut tidak bergantung pada

persamaan 10.2.1 bahwa


adalah statistik kecukupan untuk

maka menurut

( )
2. Diberikan sebuah sampel acak berukuran berdistribusi geometrik,

Gunakan persamaan 10.2.1 untuk menunjukkan bahwa


adalah statistik
kecukupan untuk .
Penyelesaian :
Untuk distribusi Geometrik, pdf diberikan oleh
(
)
(
) {
Sedangkan pdf bersamanya yaitu :
(
)
(
)
(
{

Sehingga dapat dinyatakan dalam bentuk faktorisasi


(

dan (

Karena dapat dinyatakan dalam bentuk faktorisasi maka


kecukupan untuk .

adalah statistik

3. Diberikan
adalah sampel acak berdistribusi Gamma,

Tunjukkan bahwa
adalah statistik kecukupan untuk .
a. Dengan menggunakan persamaan 10.2.1
b. Dengan menggunakan kriteria faktorisasi
Penyelesaian :
a. Pdf dari distribusi Gamma yaitu : ( )
Sedangkan pdf bersama untuk distribusi Gamma yaitu :

Diketahui bahwa
(

maka diperoleh

Jika

maka

)
(

)
(

80

Sedangkan 0 untuk yang lainnya. Karena pdf tersebut tidak bergantung pada

persamaan 10.2.1 bahwa


adalah statistik kecukupan untuk

maka menurut

b. Sedangkan pdf bersamanya yaitu :

Sehingga dapat dinyatakan dalam bentuk faktorisasi

dan (

Karena dapat dinyatakan dalam bentuk faktorisasi maka


adalah statistik
kecukupan untuk .
(
).
4. Diberikan
adalah sampel acak berdistribusi Normal,
a. Tentukan kecukupan statistik tunggal untuk dengan
diketahui.
b. Tentukan kecukupan statistik tunggal untuk dengan diketahui.
Penyelesaian :
Akan ditunjukkan bahwa

adalah statistik kecukupan untuk .

Fungsi Likelihood pada sampel tersebut yaitu :

Ketika
berikut :

)(

)(

diketahui maka dengan menggunakan kriteria faktorisasi didapatkan sebagai

dan (

Karena dapat dinyatakan dalam bentuk faktorisasi maka adalah statistik kecukupan untuk

Akan ditunjukkan bahwa


Ketika
berikut :

) adalah statistik kecukupan untuk

diketahui maka dengan menggunakan kriteria faktorisasi didapatkan sebagai

(
(
)

| dan (

81

(
Karena dapat dinyatakan dalam bentuk faktorisasi maka
) adalah statistik
kecukupan untuk
5. Pada contoh soal no 2 di atas, tentukan estimator dari
bandingkan dengan MLE pada p.
Penyelesaian :
Untuk distribusi geometrik, pdf diberikan oleh
(
)
(
) {

dengan

Fungsi Likelihoodnya
( )

( (
( )

dengan

) (
(
)
(
)
(
)
(
)

( )

Jadi estimator dari

)
)

yaitu

6. Misalkan, sampel acak n dari Distribusi Weibull,


(
).
a. Cari statistik kecukupan untuk dengan diketahui,
.
b. Jika tidak diketahui, cari statistik kecukupan tunggal untuk ?
Penyelesaian:
(
)
(

( )

a. statistik kecukupan untuk


(

dengan

diketahui,

[ ( ) ]
[ ( ) ]
[ ( ) ]
[ (

[ (
(

) ]

[
[

) ]

82

dan

)
Dan (
Maka dengan kriteria faktorisasi,
statistik kecukupan untuk .

merupakan

Dan (
Maka dengan kriteria faktorisasi,
statistik kecukupan tunggal untuk . Dan hanya terjadi jika n=1

merupakan

b. statistik kecukupan tunggal untuk


(

[ ( ) ]

Karena [ (

) ]

7. Misalkan
Tunjukkan

sampel acak dari Distribusi Eksponensial 2 parameter,


dan kecukupan bersama untuk
.

Penyelesaian:
Distribusi eksponensial dengan 2 parameter,
(
(

( )

( )

( )

( )

).

;
(

Jika , ,
sampel acak
dari teorema 10.4.6 bahwa
dan
( )
bukan fungsi parameter, jadi

adalah statistik kecukupan bersama untuk (


tidak terlibat.
(

8. Misalkan
sampel acak dari Distribusi Beta,
kecukupan bersama untuk
.

).

). Cari statistik

Penyelesaian:
(
)
( ) ( )
Untuk sampel acak ,
(

Adalah lengkap bersama dan statistik kecukupan dari


. Karena MLE fungsi satusatu dari
maka bisa digunakan pada statistik kecukupan lengkap bersama.
9. Misalkan
sampel acak dari Distribusi Bernoulli,
( )
(
)
a. Cari UMVUE dari

83

);

b. Cari UMVUE dari

Penyelesaian:
( ).
Untuk sampel acak n, ( )
untuk .
a. UMVUE dari Var( )
(

Menggunakan (
)

dan

merupakan statistik kecukupan lengkap

)]
[ (
( )
( )
)]
[ (
( ) [ ( )
( )]
)]
[ (
(
( )
(
)
)]
[ (
[ (
[ (
[ (

)]

) (
[

) adalah (

b. UMVUE dari
Menggunakan (

)]
[ (
( )
)]
( ) [ ( )
)]
(
( )

)]

)]

)(

[ (

) (

)]

(
(

(
(

(
(

84

)
)(

]
[

( )
( )]
(

)]

[ (

[ (

adalah

)(

) dimana

[ (

UMVUE dari

(
)(

)]

UMVUE dari (

[ (
[ (

)]

10. Misalkan sampel acak


[
]
.

dari Distribusi Poisson,

( );

. Cari UMVUE dari

Penyelesaian:
pdf

dengan kriteria faktorisasi,

merupakan statistik kecukupan.


( )

sehingga fungsi ( )
[ ( )]

( ) (

Karena
maka ( )

, agar [ ( )]

( )

untuk setiap koefisien

. Dengan kelengkapan,

maka dari teorema 10.4.1 jelas bahwa

fungsi tunggal

( )

harus nol. Jika


dan unbias untuk

adalah UMVUE dari .

85

( )

( )

BAB XI
ESTIMASI INTERVAL
11.1 PENDAHULUAN
Masalah estimasi titik telah dibahas dalam Bab 9. Selanjutnya, Pada bab ini akan
dijelaskan mengenai estimasi interval, bagaimana mendapatkan nilai sebenarnya dari estimasi
yang diharapkan. Beberapa informasi pada pertanyaan ini disediakan dengan mengetahui
varians atau MSE estimator. Pendekatan lain akan mempertimbangkan perkiraan interval,
bahwa sebuah interval tersebut akan berisi nilai parameter yang sebenarnya.
---------------------------------------------------------------------------------------------------------------Contoh 11.1.1
Pada contoh 4.6.3, daya tahan hidup yang diamati (dalam bulan) dari 40 sampel lampu
yang diberikan dalam tabel sebagai berikut,
0.15
2.37
2.90
7.39
7.99
12.05
15.17
17.56
22.40
34.84
35.39
36.38
39.52
41.07
46.50
50.52
52.54
58.91
58.93
66.71
71.48
71.84
77.66
79.31
80.90
90.87
91.22
96.35
108.92
112.26
122.71
126.87
127.05
137.96
167.59
183.53
282.49
335.33
341.19
409.97
Tabel 11.1.1
Diasumsikan bahwa data suatu sampel acak berukuran 40 dan berdistribusi eksponensial,
( ), dimana adalah mean (rata-rata). Pada contoh 9.3.4 ditemukan sampel mean
adalah UMVUE dari . Untuk data yang telah diberikan, estimasi dari adalah
bulan. Meskipun diketahui bahwa estimasi ini berdasar pada sebuah estimator sifat yang
optimal, sebuah estimasi titik sendiri tidak memberikan informasi yang akurat. Penyelesaian
dari masalah ini yakni dengan memperoleh interval yang batas atas dan batas bawah yang
mencakup nilai parameter
yang sebenarnya diantara yang lainnya dengan probabilitas
mendekati 1.
]=(1 )100%
[

( ) dan diketahui persentil dari


Selanjutnya perhatikan Contoh 9.3.2,
distribusi chi-square telah diberikan pada table 4 (Appendix C). Misalkan
dan
( )
( )
dan diperoleh
dan
. Sehingga diperoleh

[
]
,

[
]
---------------------------------------------------------------------------------------------------------------Pada umumnya, sebuah interval dengan batas atas dan batas bawah acak disebut interval

acak. Namun pada contoh 9.3.2 , interval (


) adalah interval acak
dengan nilai parameter yang sebenarnya dengan tingkat kepercayaan 0.95. Jika diganti
dengan
, maka interval yang dihasilkan (
). Mengacu pada interval
kepercayaan sebesar 95 % untuk . Dikarenakan estimasi interval telah diketahui memiliki
titik akhir, tidak tepat dikatakan bahwa isi nilai sebenarnya dari dengan probabilitas 0.95.
Bahwa, parameter , yang meskipun tidak diketahui, itu konstan dan pada interval tertentu

86

baik atau tidaknya berisi . Namun faktanya bahwa probabilitas dari interval acak 0.95
menegaskan 95 % kepercayaan bahwa
.
Dalam bab ini juga akan membahas definisi interval kepercayaan dan mendiskusikan
tentang metode umum untuk menurunkan interval kepercayaan
11.2 INTERVAL KEPERCAYAAN
)
Misal
pdf bersama (
, dimana adalah sebuah interval.
( )
) dan
) . Jika
( ) adalah statistik, dengan
l(
u(
) dan
sebuah data percobaan
diberikan, maka dapat diamati nilai l (
).
u(
Definisi 11.2.1
Interval Kepercayaan. Sebuah interval ( l (
interval kepercayaan untuk
[l(
Dimana

) , u(

) ) dinamakan 100

jika
)

)]

u(

. Nilai pengamatan l (

) dan u(

(11.2.1)
) masing-masing

dinamakan batas bawah dan batas atas limit kepercayaan.


Notasi lainnya yang sering ditemukan di literatur statistika yakni untuk batas bawah
limit kepercayaan dan
batas atas limit kepercayaan. Kadang-kadang digunakan juga notasi
) dan u( ) u(
) untuk pengamatan limit yang
ringkas l( ) l (
dinotasikan.
Sebenarnya, perbedaan diantara interval acak (
) dan interval pengamatan
(l( ) u( ) ) dijelaskan sebelumnya. Kondisi ini dianalogikan untuk perbedaan estimasi titik
antara estimator dan estimasinya. Terminologi lainnya, yang mana berguna untuk
mempertahankan perbedaannya disebut (
) sebuah estimator interval dan (l( ) u( ) )
sebuah estimasi interval, dengan adalah koefisien kepercayaan dan 1- adalah tingkat
kepercayaan.
Mungkin penafsiran yang paling umum dari interval kepercayaan berdasar pada
probabilitas sifat frekuensi relatif. Spesifiknya, jika estimasi interval dihitung dari banyaknya
sampel perbedaan, maka kita berharap di sekitar interval 100
yang termasuk nilai
sebenarnya . Bahwa, kepercayaan kita adalah di metode dan karena Definisi (11.2.1),
tingkat kepercayaan langsung di probabilitas sifat frekuensi.

87

Definisi 11.2.2

Limit Kepercayaan Satu Arah


1. 1. Jika
[l (
maka l( )

l(

(11.2.2)

) disebut Batas bawah satu arah 100

limit kepercayaan untuk

2. 2. Jika

u(

[
maka u( )

u(

)]

(11.2.3)

) disebut Batas atas satu arah 100

limit kepercayaan untuk

Ini mungkin tidak selalu jelas bagaimana memperoleh limit kepercayaan yang memenuhi
Definisi 11.2.1 maupun 11.2.2. Jika sebuah kecukupan tunggal statistik ada, maka satu
kemungkinan untuk menemukan limit kepercayaan yakni fungsi . Disisi lain, statistik yang
lainnya yakni MSE, mungkin diberikan.
---------------------------------------------------------------------------------------------------------------Contoh 11.2.1 :
( ) dan
Ambil sampel acak yang berukuran n dari distribusi eksponensial,
diharapkan dapat diperoleh batas bawah satu arah
limit kepercayaan untuk .
Tentukan interval kepercayaan dengan parameter !
Penyelesaian:

( ). Telah
Diketahui bahwa adalah kecukupan untuk
dan juga
dijelaskan di bab 8, persentil ke- , ( ) dapat dilihat di tabel 4 (Appendix C). Dengan
demikian,
[

(
(

Jika dapat diamati, maka batas bawah satu arah


( )
l( )

Sama halnya, batas atas satu arah


u( )

)]
]
limit kepercayaan diberikan oleh
(11.2.4)

limit kepercayaan diberikan oleh


( )

(11.2.5)

Perhatikan bahwa dalam kasus batas atas, harus digunakan nilai ketika membaca tabel 4.
Contoh, jika batas atas 90 % limit kepercayaan diperoleh dari
. Untuk
( )
sampel ukuran
, persentil yang diperlukan yakni
, sehingga batas
atas limit kepercayaan yakni u( )

.
Anggaplah bahwa diinginkan
limit kepercayaan untuk . Jika dipilih nilai
dan
seperti
, maka

88

)]

Dan dengan demikian,


[
Pada umumnya di misalkan
akan berarti

)]

, yang mana diketahui sebagai equal tailed choice dan


Sehingga interval kepercayaannya
( )
( ))
(

(11.2.6)
---------------------------------------------------------------------------------------------------------------Pada umumnya, untuk penentuan tingkat kepercayaan, kita ingin menggunakan metode
yang akan menghasilkan interval dengan mengoptimalkan sifat seperti panjang minimal.
Sebenarnya, panjang,
, sesuai dengan interval acak pada umumnya akan menjadi
variabel acak, jadi standar seperti Panjang Ekspektasi Minimum akan lebih tepat. Untuk
beberapa masalah, equal tailed choice
dan
akan disediakan panjang ekspektasi
maksimum, tetapi tidak untuk yang lain. Contohnya, interval (11.2.6) contoh sebelumnya
tidak memiliki sifat (lihat latihan 26).
Contoh 11.2.2
Diberikan sampel acak dari distribusi normal.
(
), dimana
diasumsikan

telah diketahui. Dalam kasus ini,


adalah kecukupan untuk . Tentukan interval
kepercayaan dari
!
Penyelesaian:
Telah diketahui
)
(0,1). Dari kesimetrian, juga tahu bahwa
(
, dengan demikian
(

[
[
Bahwa

interval kepercayaan untuk


(

diberikan oleh

)
maka

Untuk contoh 95% interval kepercayaan,


(

[
[
[

]
]

Sehingga diperoleh interval kepercayaan untuk


(

)
---------------------------------------------------------------------------------------------------------------Perhatikan permasalahan ini tidak dapat diterima jika
tidak diketahui, karena limit
kepercayaan tergantung pada parameter yang tidak diketahui dan tidak dapat dihitung.
Dengan sedikit modifikasi diperoleh interval kepercayaan untuk dan adalah parameter
yang sulit diketahui. Kesulitan utama dalam menentukan interval yang muncul di kasus

89

multiparameter adalah dimana parameter yang sulit diketahui ada. Untuk permasalahan ini
aka nada di bagian selanjutnya.
Di kasus multiparameter mungkin diinginkan daerah kepercayaan bersama bahwa
berlaku juga untuk semua parameter secara serentak. Daerah kepercayaan untuk parameter
tunggal, di kasus satu dimensi, akan ada beberapa keadaan selain dari interval. Pada
umumnya, jika
, maka daerah lainnya
(
) di
adalah 100
daerah
kepercayaan jika probabilitas bahwa (
) mengandung nilai sebenarnya .
11.3 METODE KUANTITAS PIVOT
Misalkan
dengan pdf bersama (
) dan dengan harapan untuk
mendapatkan batas kepercayaan dimana parameter parameter lain juga ada.
Definisi 11.3.1 (Kuantitas Pivot)
Jika Q = (
) adalah peubah acak dari suatu fungsi dengan peubah
dan
, maka Q dikatakan kuantitas pivot jika distribusinya tidak bergantung dan parameter
yang lain.
---------------------------------------------------------------------------------------------------------------Contoh 11.3.1
Dalam contoh 11.2.1, terdapat peubah acak yang berdistribusi chi square dan
kuantitas pivot Q =

. Bagaimana mendapatkan Q dari pernyataan probabilitas ke bentuk

batas kepercayaan untuk ?


Penyelesaian :
Jika Q adalah kuantitas pivot untuk parameter dan jika persentil Q dimisalkan
ada sehingga terdapat [
(
)< ]
(11.3.1)
maka untuk sampel yang diselidiki
dan daerah kepercayaan untuk sebesar
100
merupakan bagian dari
dengan
(
)<
(11.3.2)
Dengan kata lain daerah kepercayaan tidak akan memerlukan suatu interval. Namun di
sisi lain, terdapat satu keadaan yang penting untuk mendapatkan interval kepercayaan ketika
untuk suatu sampel acak
dengan fungsi (
) adalah monoton naik atau
monoton turun terhadap fungsi. Ini juga mungkin digunakan untuk menentukan distribusi apa
yang akan digunakan untuk mendapatkan kuantitas pivot.
Teorema 11.3.1
Diberikan

adalah sampel acak dari suatu distribusi dengan pdf (

diasumsikan MLE ada.


1. Jika

adalah parameter lokasi, maka Q =

2. Jika

adalah parameter skala, maka Q =

90

adalah kuantitas pivot


adalah kuantitas pivot

) untuk

dan

Untuk pengertian parameter lokasi dan parameter skala telah dibahas di subbab 3.4
hal.124 pustaka utama dan tentang MLE telah dibahas pada subbab 9.4 hal.316 pustaka
utama tentang sifat sifat asimtotik.
Teorema 11.3.2
Diberikan

adalah sampel acak dari suatu distribusi dengan parameter lokasi-skala


(

jika MLE dan ada, maka (

)=

) dan

adalah representasi dari kuantitas pivot

dan

Perlu diperhatikan bahwa (


)
yang berdistribusi dengan parameter bebas,
bukan kuantitas pivot kecuali jika
diketahui, atau dengan kata lain tidak nol.
---------------------------------------------------------------------------------------------------------------Contoh 11.3.2
Diberikan sampel acak dari distribusi normal,
(
), dimana
dan
tidak

diketahui. Jika dan adalah MLE (Maximum Likelihood Estimator) maka


dan

adalah kuantitas pivot, maka tentukan interval kepercayaan untuk setiap parameter dengan
mempertimbangkan parameter lainnya!
Penyelesaian :
Seperti yang telah dibahas pada bab 9, MLE akan sesuai untuk menyatakan hasil dari
bentuk estimasi unbias
(
) dengan mengambil kemudahan dari bentuk
distribusi yang berkaitan dengan
(
), yang telah diketahui berikut.
), maka distribusi t
Jika
dinotasikan dengan sampel acak dari (

(11.3.3)

dan distribusi chi-square


(

Jika

(11.3.4)
(

) adalah persentil ke (

dengan derajat kebebasan (

), maka

sehingga nilai mean dari 100 (


(

) dari distribusi T-Student

]=

terhadap interval kepercayaan untuk

adalah

(11.3.5)

dengan memperhatikan nilai dan s


Dengan cara yang sama, jika
adalah masing masing persentil ke
derajat kebebasan (
), maka

(
dan

91

) dan

dari distribusi Chi-square dengan

[
[(

]] =
)

sehingga nilai means dari 100 (


(

terhadap interval kepercayaan untuk

adalah

(11.3.6)

---------------------------------------------------------------------------------------------------------------Pada dasarnya, jika (


) adalah interval kerpercayaan dari 100% untuk parameter
dan jika () adalah fungsi monoton naik terhadap maka ( ( ), ( )) adalah interval
kerpercayaan dari 100% untuk parameter ()
---------------------------------------------------------------------------------------------------------------Contoh 11.3.3
Dalam contoh 9.2.13 tentang sampel acak berukuran n dari distribusi Weibull
(
) telah dibahas. Untuk soal ini yang ditanyakan adalah tentukan kuantitas pivot
untuk parameter
!
Penyelesaian :
Walaupun distribusi Weibull bukan model lokasi-skala, namun tidaklah sulit untuk
menunjukkan bahwa distribusi dari Yi = ln Xi mempunyai suatu nilai ekstrim terhadap
distribusi dalam suatu model lokasi-skala. Secara khusus akan dituliskan sebagai berikut
(

)=
( )

dimana
dan

), dari teorema 11.3.2

(11.3.7)

(
). Hubungan antara parameter parameternya adalah
, dengan demikian

(11.3.8)
dan

(11.3.9)
adalah kuantitas pivot dari
---------------------------------------------------------------------------------------------------------------Jika
(
) dan jika (
) adalah CDF dari , dari teorema 6.3.3 hal.201
)
pustaka utama, tentang probabilitas transformasi integral , maka (
( ) dan
(
)
( ) Untuk sampel acak
maka juga bisa didekati dengan
distribusi Chi-Square

(
)
( )
(11.3.10)
sehingga
[

(11.3.11)

92

)]

(
)
( ), maka bisa didekati
Jika (
) fungsi monoton, maka 1
dengan

(
))
(
( )
(11.3.12)
---------------------------------------------------------------------------------------------------------------Contoh 11.3.4
Diberikan sebuah sampel acak dari distribusi Pareto
PAR( ) . Tentukan interval
kepercayaan dari 100(
)% !
Penyelesaian :
)= 1 (
CDF (
) ,x>0
gunakan persamaan
(

(
(

))

( (

))

)) =

(
(

)
), sehingga

sehingga dengan distribusi chi-square interval kepercayan dari dari 100(


)% adalah
( )
( )
(
)

(
)
(
)
---------------------------------------------------------------------------------------------------------------11.3.1 PENDEKATAN INTERVAL KEPERCAYAAN
Diberikan
adalah sampel acak dengan pdf (
). Berdasarkan penjelasan di
bab 9, MLE normal asimtotik dalam suatu kondisi.

Contoh 11.3.5
Diberikan sampel acak berdistribusi Bernoulli,
interval kepercayaannya !
Penyelesaian :
MLE dari p adalah =

). Tentukan pendekatan

. Kita juga tau bahwa adalah kecukupan dan bahwa

), namun tidak ada kuantitas pivot untuk p, dengan teorema limit pusat
(

BIN(

(11.3.13)
untuk sampel berukuran n, mencari interval kepercayaan
[

(11.3.14)
Pendekatan ini dapat ditingkatkan dengan menggunakan koreksi secara kontinu, yang
dibahas pada bab 7, namun di sini tidak ditekankan. Batas untuk suatu pendekatan 100

93

(
)
merupakan interval kepercayaan (
menyelesaikan penyelesaian dari adalah

) untuk p yang didapatkan dari

(11.3.15)
dan penyelesaian dari

adalah

(11.3.16)
secara umum

(11.3.17)

saat
yang telah ditunjukkan pada contoh 7.7.2 hal.249 pustaka utama, maka untuk
sampel yang berukuran , hasil pendekatannya

(11.3.18)
dengan nilai pendekatan interval kepercayaannya

(
)
(11.3.19)
---------------------------------------------------------------------------------------------------------------Contoh 11.3.6
Diberikan sampel acak berukuran n dari distribusi Poisson
( ) . Tentukan
pendekatan interval kepercayaannya !
Penyelesaian :
( ) , dengan Teorema Limit Pusat

(11.3.20)

dengan teorema 7.7.4 (teorema Slutsky)


Jika

dan

adalah dua barisan variabel acak yang mana

dan

4.
5.

untuk
6.
untuk kejadian khusus,
maka

( )

saat

(11.3.21)

, peubah peubah acak dapat digunakan untuk menentukan pendekatan dari

interval kepercayaan, walaupun

( )

) lebih tepat digunakan.

----------------------------------------------------------------------------------------------------------------

94

11.4 METODE UMUM


Jika kuantitas pivot tidak sesuai saat digunakan, maka masih bisa menentukan daerah
kepercayaan untuk parameter
jika terdapat data statistik dengan distribusinya yang
bergantung pada parameter , tapi tidak untuk parameter lain yang tidak diketahui. Misal
diberikan
dengan pdf bersama (
) dan S = (
) (
).
Lebih baik jika S akan di cukupi terhadap , atau beberapa kemungkinan estimator lain
seperti MLE.
Sekarang untuk setiap kemungkinan nilai diasumsikan bahwa dapat ditentukan nilai
( ) dan ( ) sehingga
[ ( )
( )]
(11.4.1)
Jika memperhatikan S = s , maka bagian dari nilai sesuai dengan ( )
( )
dari daerah kepercayaan 100 (
) %. Dengan kata lain, jika
bernilai benar atau sesuai
dengan , maka
akan menjadi daerah kepercayaan jika dan hanya jika ( )
( ), yang mempunyai tingkat kepercayaan 100 (
) %, karena persamaan [ ( )
( )]
sesuai saat
dalam kasus ini. Selanjutnya sering dikatakan bahwa
( ) dan ( ) adalah fungsi monoton naik atau monoton turun terhadap , dengan hasil
daerah kepercayaannya berupa suatu interval.
---------------------------------------------------------------------------------------------------------------Contoh 11.4.1
Diberikan sampel acak berukuran n dari distribusi kontinu dengan pdf

dengan
!

. Dapatkan interval kepercayaan sebesar 95% untuk

menurut statistik S =

Penyelesaian :

dengan
, tidak ada statistik kecukupan tunggal, tapi
dan
adalah kecukupan
bersama terhadap . Hal ini diinginkan untuk mendapatkan interval kepercayaan sebesar 90%
untuk menurut statistik S =
. CDF dari S adalah

Suatu kemungkinan untuk memilih fungsi ( ) dan ( )yang sesuai dengan


[ ( )
( )]
, sehingga didapat penyelesaian
( ( ); )
dan ( ( ) ; )

95

---------------------------------------------------------------------------------------------------------------Fungsi dari ( ) dan ( ) untuk metode umum mengkonstruksi suatu selang


kepercayaan digambarkan pada grafik berikut:

Grafik 11.1
dengan
( )

dan
(
)
( )
Grafik 11.1 terdiri atas parameter ( ) dan ( ) ,dengan n = 10.
Umumnya jika ( ) dan ( ) keduanya naik, maka titk akhir dari suatu interval
kepercayaan dapat diputuskan dengan meperhatikan
sebagai penyelesaian untuk batas
bawah
yaitu ( )
dan untuk batas atas
yaitu ( )
. Pernyataan bahwa
(
) adalah interval kepercayaan dari 100(
) digambarkan dalam grafik berikut .

Grafik 11.2

96

Teorema 11.4.1
Diberikan statistik S adalah kontinu dengan CDF (

) dan diberikan

( ) dan

( ) adalah
(11.4.2)

fungsi dengan ( ( ) ; )

(11.4.3)

dan ( ( ) ; )
terhadap
dan jika

, dimana 0 <
( ) dan

<1 dan 0 <

<1. Misalkan

suatu nilai yang diperhatikan dari


(11.4.4)
, maka pernyataan
berikut

( ) adalah fungsi naik dengan parameter

beralasan :

(11.4.5)

1. Batas bawah satu arah dari 100(


penyelesaian

,dengan

adalah pendekatan kepercayaan untuk

,dengan

( )

2. Batas atas satu arah dari 100(


penyelesaian

adalah pendekatan kepercayaan untuk

3. Jika

)
<1, maka (

dan 0 <

) adalah interval kepercayaan 100(

untuk parameter
---------------------------------------------------------------------------------------------------------------Contoh 11.4.2
Misalkan sampel acak berdistribusi eksponensial
( ) dan S =
adalah
kecukupan bersama dengan , tentukan ( ) dan ( ) !
Penyelesaian :
Diketahui
( ) dan S =
adalah cukup bersama dengan . Karena S =

adalah cukup bersama dengan , maka 2S/


( ).
Untuk ( )
[
( )]= [
( ) ]
yang berakibat
( )

), sehingga

( )

ini adalah fungsi naik terhadap dan penyelesaian dari


arah dari
100(
) , dengan
Untuk ( )
[
( )]= [
yang berakibat
( )

), sehingga

( )

( )

( )
( ).

)
merupakan batas atas satu

( )
( )

ini adalah fungsi naik terhadap dan penyelesaian dari ( )


merupakan batas bawah
satu arah dari 100(
) , dengan
( ).
----------------------------------------------------------------------------------------------------------------

97

Teorema 11.4.2
Diberikan statistik S adalah kontinu dengan CDF (
dari S. Jika (

) adalah fungsi turun terhadap


)

1. Batas bawah satu arah dari 100(


(

batas kepercayaan untuk

,dengan (11.4.6)
penyelesaian

batas kepercayaan untuk

(11.4.7)

,dengan penyelesaian

3. Jika
untuk

,maka pernyataan berikut beralasan :

2. Batas atas satu arah dari 100(


(

) dan diberikan suatu nilai pengamatan

dan 0 <

<1, maka (

) adalah interval kepercayaan 100(

Definisi 11.4.1
Suatu pengamatan terhadap interval kepercayaan (L, U) disebut konservatif 100 (1- )%
interval kepercayaan untuk jika interval acak cocok memuat nilai yang benar dari dengan
probabilitas paling sedikit 1-
Teorema11.4.3
Misalkan S adalah suatu statistik dengan CDF G (s; ) dan misalkan h1 () dan h2 () merupakan
fungsi dari G(h1(); ) = 1 dan P[S < h2 (); ] = 1- 2

(11.4.8)

dimana 0 < 1 < 1 dan 0 < 2 <1


1. Jika h1() dan h2() adalah fungsi naik, maka terdapat suatu batas bawah satu arah
konservatif 100(1-2)% batas kepercayaan untuk , bergantung pada nilai s yang diamati
dari S, penyelesaian dari h2 (L) = s, atau = L seperti P[S <s;L] = 1- 2.

(11.4.9)

Suatu batas atas satu arah konservatif 100(1-1)% adalah batas kepercayaan, yang
merupakan suatu penyelesaian dari h2 (U) = s, atau G(s; U) = 1
2. Jika h1 () dan h2 () adalah fungsi turun, maka batas bawah satu arah konservatif
100(1-2)% yang merupakan penyelesaian dari h1(L)=s, atau G(s;L) = 1.
Suatu batas atas satu arah konservatif 100(1-2)% adalah batas kepercayaan, yang
merupakan penyelesaian dari h2 (U) = s, atau = U seperti P[S<s; U] = 1-2
3. Dalam kasus lain, jika = 1 2 dan 0 << 1, maka (L, U) adalah suatu interval (11.4.10)
kepercayaan 100(1-)% yang konservatif untuk .
Suatu tingkat kepercayaan kemungkinan tidak diterima jika S adalah fungsi diskrit,
namun tingkat kepercayaan pada dasarnya menyatakan suatu ukuran seberapa besar data

98

tersebut dapat dipercaya. Tentunya ini memerlukan kondisi dalam pertidaksamaan tegas
berikut :
P[S < h2 (); ] = 1- 2;
P[S < s; L] = 1- 2 ;
P[S<s; U] = 1- 2
Tentu saja, jika S adalah fungsi kontinu, maka P[S < s; L] = G(s;) dan dari aplikasi
teorema sebelumnya didapatkan tingkat kepercayaan yang eksak.
Untuk mendapatkan kasus dari distribusi diskrit, G(s;), dimana hi=() adalah fungsi
naik dan G(s;) adalah fungsi turun dari . Ambil S nilai diskrit s1, s2, dan ambil nilai
parameter 1,2, dengan G(si; i) = . Jika diamati bahwa S=si , maka ambil U=i sebagai
batas atas 100(1-)% dari batas kepercayaan. Tingkat kepercayaan akan menjadi lebih dari
1- untuk nilai tengah dari . Jika i-1<<i
maka interval kepercayaannya akan
mengandung jika nilai yang diamati dari S itu si, dengan probabilitas:
P [S si | i-1< <i] = 1- G(si-1 ; )
1- G (si-1 ; i-1)
=1
Dengan cara yang sama, anggap G (si ; ) = 1- dan L = i-1. Jika S = si, maka L adalah
penyelesaian dari G(si-1 ; L) = 1- . Sekarang pertimbangkan nilai dari i-1 < < i . Nilai ini
akan menjadi interval kepercayaan jika S
dengan probabilitas
P [S si | i-1< <i] = G (si; )
G (si; i) = 1
---------------------------------------------------------------------------------------------------------------Contoh 11.4.4
Dalam contoh 11.3.5, dua pendekatan ditampilkan untuk memperoleh pendekatan
interval kepercayaan untuk parameter binomial p, berdasarkan sampel pendekatan yang
besar. Dapatkan suatu batas konservatif (1 ) 100% batas kepercayaan untuk p dan

dapatkan interval kepercayaan konservatif 90% untuk p, jika diketahui


adalah
statistik kecukupan !
Penyelesaian :

Diketahui bahwa
adalah statistik kecukupan dan S~BIN(n,p). Tidak akan
ditemui pernyataan eksplisit untuk h1(p) dan h2(p) dalam contoh ini, tapi perhatikan bahwa
G(s;p)=B(s;n,p) adalah fungsi naik dari p. Dengan demikian, untuk mencari nilai s,
penyelesaian dari:
(

( )

adalah suatu batas atas satu arah yang konservatif dan penyelesaian dari:
(

( )

adalah suatu batas bawah satu arah yang konservatif. Jika


)
kepercayaan konservatif dari (1 )100% ditunjukkan oleh (

99

)
maka interval

Untuk nilai yang lebih spesifik dari s,


dapat ditentukan dengan interpolasi
dari tabel komulatif binomial seperti pada Tabel 1 (Appendix C) pada pustaka utama, atau
dapat ditunjukkan dengan penggunaan metode numerik pada CDF. Sebagai contoh, anggap
n=10 dan s= 2. Jika
maka B(2;10, 0.507) = 0.05 dan B(2; 10, 0.55) = 0.0274. Hasil
interpolasi linier
dengan cara yang sama, jika
maka B(1; 10, 0.037) =
0.95 dan
hal itu menunjukkan bahwa (0.037, 0.507) adalah interval kepercayaan
konservatif 90% untuk p.
---------------------------------------------------------------------------------------------------------------Contoh 11.4.5
Ingat kembali cara untuk mendapatkan pendekatan dari interval kepercayaan untuk ratarata,, menggunakan distribusi Poisson yang telah dibahas di contoh 11.3.6. untuk sampel
dan S~POI(n).
acak berukuran n, Xi ~POI(), statistik kecukupannya adalah
Tentukan interval kepercayaan konservatif (1 )100% untuk !
Penyelesaian :
dan S~POI(n), karena CDF distribusi Poisson
Diketahui Xi ~POI(),
berhubungan dengan CDF distribusi chi-square, batas kepercayaan dapat ditunjukkan dengan
baik pada persentil chi-square. Jika ditunjukkan oleh H(y; v) adalah CDF dari variabel chisquare dengan derajat kebebasan v , maka batas kepercayaan konservatif (1 )100% untuk
dan untuk nilai s yang diamati , adalah suatu penyelesaian dari
(
)
(
)
dengan
(
)
(

dan dapat diberikan

dengan cara yang sama, suatu konservatif bawah konservatif (1 2)100% batas kepercayaan
untuk adalah penyelesaian dari
1 2 G(s 1; L) = 1 H (2n L; 2s)
sehingga 2n L =

) dan

Jika 1 = 2 = /2 maka interval kepercayaan konservatif (1 )100% untuk diberikan oleh


( ( )
)
)
(
(11.4.11)
Metode umum ini dapat dipakai dalam berbagai masalah yang berparameter tunggal tidak
diketahui.
---------------------------------------------------------------------------------------------------------------Teorema11.4.4
Misalkan X1,,Xn adalah sampel acak berukuran n dari distribusi dengan pdf
(11.4.12)

(
Dimana

f0 (z; ) adalah pdf yang bergantung pada , bukan pada

1 atau 2. Jika MLE pdf tersebut 1, 2, , maka distribusi dari (


bergantung pada 1 dan 2.
100

2/

dan tidak

Ini menunujukkan bahwa metode ini, secara umum dapat digunakan dengan parameter
untuk menentukan batas kepercayaan pada , dengan 1, 2 parameter lain yang tidak
diketahui. Tentu saja jika diketahui, maka kuantitas pivot (
) dan
dapat
digunakan untuk menentukan interval kepercayaan untuk 1 dan 2. Teorema 11.3.2 juga
digunakan dalam situasi ini, karena 1 dan 2 adalah parameter skala lokasi ketika
diketahui. Hal tersebut tidak boleh diabaikan dalam menghadapi persoalan bagaimana
mendapatkan batas kepercayaan untuk 1 dan 2 ketika tidak diketahui
Teorema11.4.5
Misalkan X1,,Xn adalah sampel acak berukuran n dari distribusi dengan CDF (

Dimana 1 dan 2 adalah parameter skala posisi dan menunjukkan bahwa MLE dan ada.
Jika t adalah nilai pasti, maka F(t; ) adalah sebuah statistik yang distribusinya bergantung
pada t, 1 dan 2 dalam CDF F(t; 1; 2)
Berdasarkan kasus dimana F(x; 1; 2) = F0-1 [F(t; 1; 2)] dengan F0(z) adalah fungsi
satu-satu pada. Dimisalkan: c = (t-1)/ 2 = Fo-1[F(t; 1; 2)]
yang bergantung pada t, 1 dan 2 dalam CDF F(t; 1; 2) , ini mengikuti bentuk
F(t;
. 1, 2) = Fo[(t- 1)/ 2]
= Fo[c(2/ 2) - ( 1 - 1)/ 2]
yang merupakan sebuah fungsi dari c dan kuantitas pivot ( 1 - 1)/ 2 dan 2/ 2, sehingga
distribusi bergantung pada F(t; 1, 2) tapi tidak pada setiap parameter lain yang tidak
diketahui
---------------------------------------------------------------------------------------------------------------Contoh 11.4.6
Pertimbangkan kuantitas R(t) = P[X > t] = 1 F(t; 1,2)
Dapatkan batas bawah batas kepercayaan (1 )100% !
Penyelesaian :
R(t) = P[X > t] = 1 F(t; 1,2)
Hal ini adalah kuantitas yang penting dalam suatu aplikasi dimana X menunjukkan waktu
kegagalan atau waktu hidup sebuah percobaan. Dalam suatu aplikasi hal ini disebut fungsi
tahan uji, terkadang juga disebut fungsi bertahan. Hal ini mengikuti teorema sebelumnya
tentang distribusi tahan uji dari MLE. ( )
( ) yang bergantung hanya pada
R(t).
Untuk beberapa contoh spesifik, ambil sebuah sampel acak berukuran n dari dua
parameter yang berdistribusi eksponensial, Xi ~EXP(, ). MLE-nya adalah

dan
()
[( )
[ (
) ]

Jika Y = ( ) maka dapat ditunjukkan bahwa CDF, G(y; R(t)) naik di R(t) untuk setiap y.
Dengan demikian, berdasarkan teorema 11.4.2, batas bawah satu arah untuk batas
( )

[ (

) ]

101

( ( )

kepercayaan (1 )100%, diperoleh dengan penyelesaian

( ))

Untuk

menentukan ( ) sedikit rumit dalam kasus ini.


---------------------------------------------------------------------------------------------------------------11.5 MASALAH DUA SAMPEL
Sering dijumpai suatu sampel acak diambil dengan tujuan untuk membandingkan dua
atau lebih populasi. Hal ini menarik dalam membandingkan bentuk mean dari dua proses atau
variasi yang relatif dalam dua proses. Interval kepercayaan di sini digunakan untuk
perbandingan yang berkaitan dengan batas atas dan batas bawah.
11.5.1 PROSEDUR DUA SAMPEL NORMAL
Pertimbangkan sampel acak independen berukuran n1 dan n2 dari dua populasi yang
berdistribusi normal masing-masing Xi~N (
) dan
(
). Ini berarti bahwa dan
adalah sampel rata rata, sedangkan
dan
adalah dan sampel variasi.
Pada dasarnya estimator titik unbias
dapat dihitung, tapi jika hanya ada
perbedaan estimasi yang kecil, maka mungkin saja itu tidak jelas, apakah hasil perbedaan
dari perbedaan yang sebenarnya dalam variansi, atau apakah hasil perbedaan dari galat
sampel acak. Dengan kata lain, jika variansi distribusi tersebut sama, maka perbedaan sampel
variansi berdasarkan lebih dari dua sampel, kemungkinan diperlukan petunjuk yang berbeda.
Perhatikan juga jika ukuran sampel besar, maka akan memperlihatkan suatu perbedaan kecil
antara estimasi yang dapat mengindikasikan perbedaan nilai parameter juga; tetapi jika
ukuran sampel kecil, maka perbedaan yang besar hampir mungkin hasil dari peluang. Interval
kepercayaan mendekati penggabungan pada suatu estimasi interval.
11.5.2 PROSEDUR UNTUK VARIANSI
Suatu interval kepercayaan utuk rasio
dapat diturnukan dengan distribusi F
Snedecor pada contoh 8.4.1 hal.277 pustaka utama, diketahui bahwa
~ F (n1 -1, n2 1)

(11.5.1)

yang memberikan kuantitas pivot untuk


Persentil dari distribusi F dengan v1 = n1 -1
dan v2 = n2 1 dapat diperoleh dari Tabel 7(Appendix C) pustaka utama. Jadi
[

dan dapat dikatakan jika


dan
untuk
dapat diberikan:
(

)]

(11.5.2)

adalah estimasi, maka interval kepercayaan (1

)100%

))

(11.5.3)
---------------------------------------------------------------------------------------------------------------Contoh 11.5.1
Sampel acak dengan ukuran n1= 16 dan n2=21 dengan estimasi
dan
dan 90% interval kepercayaan diinginkan. Tentukan interval kepercayaan 90% untuk
!

102

Penyelesaian :
(

Dengan menggunakan hubungan

, dan dari tabel 7 appendix C

(
)
(
)

didapat
(
)
=0,429. Hal
tersebut menunjukkan bahwa (0.143, 0.733) adalah 90% interval kepercayaan untuk
.
Karena intervalnya tidak memuat nilai 1, dapat disimpulkan bahwa
dan dua populasi tersebut memiliki variansi yang berbeda. Karena tingkat kepercayaannya
90%, jika hanya 10% hasil akhirnya, maka dalam rata-rata akan salah.
11.5.3 PROSEDUR UNTUK MEANS
Jika variansi,
dan
, diketahui, maka jumlah pivot untuk persamaan
hal mudah. Karena

adalah

(11.5.4)

dapat ditunjukkan bahwa

(11.5.5)

Dengan Z, pernyataan P[-z1-/2 < Z < z1-2]=1 dapat diselesaikan dengan mudah untuk
menghitung batas kepercayaan (1 )100%, yaitu

Jika

(11.5.6)
diasumsikan sebagai suatu varians gabungan

maka
(

(11.5.7)
(

dan jika mengasumsikan

(11.5.8)

maka diperoleh hubungan


(

Jadi benar bahwa

(
bebas dari

(11.5.9)

dan

sehingga dengan Z diberikan oleh persamaan

), dengan

dan V diberikan oleh

mengikuti dari Teorema 8.4.1 di hal.274 pustaka utama bahwa

Batas untuk interval kepercayaan (1

)100% untuk
)

(11.5.10)
diberikan
(11.5.11)

----------------------------------------------------------------------------------------------------------------

103

Contoh 11.5.2
Sampel acak dengan ukuran n1 = 16 dan n2 =21 berestimasi

dan
.Dapatkan suatu interval kepercayaan 90% untuk rasio dua varians yang
bertujuan memeriksa asumsi persamaan varians dengan menggunakan prosedur untuk mean!
Penyelesaian :
Interval kepercayaan 90% untuk
adalah (0,358 , 1,83). Dengan demikian, tidak
ada bukti kuat bahwa suatu varians tidak sama dan akan diasumsikan bahwa
.
Estimasi variansnya adalah
(
)
(
)
(

)(

) (

)(

= 0, 109

dan didapat = 0,330.


Misalkan bahwa 95% interval kepercayaan untuk
diinginkan. Dengan interpolasi
linear antara t0,975(30) = 2,042 dan t0,975(40) = 2,021, dalam tabel 6 (Appendix C) pustaka
utama, didapatkan juga t0,975(35) = 2,032. Interval kepercayaan berdasarkan batas dalam
persamaan

adalah (0,688 , 1,133).


---------------------------------------------------------------------------------------------------------------11.5.4 METODE PENDEKATAN
Tidak mudah mengeliminasi variansi yang tidak diketahui untuk menghitung jumlah
pivot untuk
ketika variansinya tak hingga. Satu pendekatan yang mungkin yaitu
dengan metode sampel besar. Khususnya ketika
dan

(11.5.12)
Persamaan ini digunakan untuk sampel besar.
Adapun untuk sampel kecil dari distribusi normal, distribusi dari variabel acak dalam
persamaan di atas bergantung pada
dan
, tapi pendekatan yang baik dalam sampel kecil
digunakan distribusi-t dengan persamaan berikut

( )

(11.5.13)
dimana derajat kebebasannya adalah
(

(11.5.14)
[(

) (

)] [(

) (

)]

104

11.5.5 PROSEDUR SAMPEL BERPASANGAN


Andaikan terdapat sebuah sampel acak dari n pasang, (Xi, Yi) dan diasumsikan bahwa
Di = Yi Xi untuk i=1, , n adalah distribusi Normal dengan mean
dan
variansi
atau Di ~ N (
)

Misalkan
(11.5.15)
dan

(
(

(11.5.16)
Berdasarkan hasil di Bab 6 bahwa
(

(11.5.17)
dengan demikian interval kepercayaan (1 ) 100% untuk
mempunyai batas :

(
(11.5.18)
dimana dan sD diketahui.
Perhatikan bahwa metode ini valid jika sampelnya bebas, karena pada kasus ini
(
) bagaimanapun, derajat kebebabasan dalam sampel berpasangan
adalah n 1, sedangkan dalam kasus sampel bebas dengan
diperoleh suatu t statistik
dengan derajat kebebasan 2n 2. Oleh karena keefektifan ukuran sampel adalah dua kali dari
sampel bebas maka metode sampel berpasangan kurang baik digunakan. Bagaimanapun, jika
ada alasan ada suatu sampel yang berpasangan dan pasangannya memiliki korelasi yang
tinggi, maka
lebih kecil dari
dan ini dapat merugikan
keefektivan ukuran sampel.
Hal yang menarik untuk dicatat bahwa jika dua sampel bebas memiiliki ukuran yang
sama dengan variansi yang berbeda, maka prosedur sampel berpasangan masih dapat
digunakan untuk menentukan suatu t statistik dengan syarat perbedaan hasil interval akan
cenderung menjadi lebih luas daripada saat menaksir variabel seperti persamaan 11.5.13.

11.5.6 PROSEDUR DUA-SAMPEL BINOMIAL / SELISIH DUA PROPORSI


Misalkan X1~BIN(n1,p1) dan X2~BIN (n2,p2) . Ambil = X1 dan = X2/n2. Dari hasil
pada Bab 7, didapatkan

)
(

(11.5.19)

Ini jelas bahwa pendekatan batas kepercayaan untuk sampel besar dengan parameter
dapat digunakan dalam suatu ketentuan seperti kasus dalam sebuah sampel, dengan

105

(11.5.20)

11.6 ESTIMASI INTERVAL BAYES


Estimasi Bayes telah didiskusikan secara singkat di bab 9 untuk kasus estimasi titik.
Dalam pembahsannya suatu parameter diperlakukan dengan kasus variabel acak yang sesuai
secara matematis. Contohnya parameter yang digunakan sebagai variabel kondisi yang
tentunya berbeda, dalam suatu eksperimen. Prior density, ( ) mungkin dipertimbangkan
untuk memberikan hasil yang sesuai yang berkaitan dengan nilai parameter yang benar dan
struktur Bayes menyediakan kerangka yang cocok untuk menggunakan ( ) yang sesuai
kepercayaan untuk mengatasi suatu fungsi kendala dengan memilih estimasi terbaik (kendala
yang lebih kecil). Dalam kasus ini, prior density tidak berbeda dari interval kepercayaan
.
Ketika nilai
beragam dari 0 sampai hasil interval kepercayaan untuk
,dapat
direpresentasikan saat menentukan distribusi peluang untuk . Distribusi dalam kasus ini
berdasarkan pada beberapa data yang berkriteria subyektif.
Dalam berbagai persoalan, andaikan prior density ( ) ada atau bisa dimasukkan dalam
permasalahan dan (
) di gunakan juga dalam pdf bersyarat ( | ). Misalkan lagi
posterior density dari diberikan oleh sampel (
),
|

( )

| ) ( )
| ) ( )

(11.6.1)

Prior density ( ) dapat digunakan sebagai suatu kemungkinan inisial yang spesifik dari
suatu distribusi untuk nilai yang sesuai dan pada kaitannya | ( ) akan direpresentasikan
sebagai distribusi yang sesuai dengan variabel acak yang diamati. Untuk tingkat
,
interval kepercayaan Bayes untuk yang diberikan oleh (L, U), dengan L dan U adalah
batas untuk

( )

(11.6.2)
Jika adalah variabel acak yang benar, maka interval Bayes akan biasa saat dinyatakan
sebagai Interpretasi Peluang. Tentu saja, dalam banyak kasus, hasil yang benar hanya untuk
menunjukkan bahwa model yang diasumsikan benar. Jika ( ) adalah representasi dari
tingkat kepercayaan terhadap nilai , maka mungkin interval (L, U) juga direpresentasikan
dalam tingkat kepercayaan juga.
---------------------------------------------------------------------------------------------------------------Contoh 11.6.1
Pada Contoh 9.5.5, dimisalkan bahwa Xi ~ POI () dan ~ GAM(, ). Tentukan
Interval kepercayaan Bayes untuk jika diberikan oleh batas bawah dan batas atas
(L, U) !
Penyelesaian :
Distribusi posterior dari ~ GAM(, ), didapatkan persamaan
)
|
[(
]
(11.6.3)
yang menunjukkan bahwa

106

[ (

)]

(11.6.4)
dan P[ 2 / 2(v) < 2(n+1/)x< 1-/22 (v)] = 1
(11.6.5)
dengan
(
), maka
100(1- )% interval kepercayaan Bayes untuk diberikan oleh batas bawah dan batas atas
(L, U) dimana batas bawah L = 2 / 2(v) / 2(n+1/) dan batas atas U = 1-/22 (v)/ 2(n+1/).
RINGKASAN
Tujuan penting dari bab ini adalah untuk memperkenalkan konsep sebuah estimasi
interval atau interval kepercayaan. Suatu estimator titik sendiri tidak memberikan keakuratan
nilai. Suatu estimator interval memberikan penyelesaian yang mungkin untuk masalah ini.
Konsep ini melibatkan suatu interval yang titik akhirnya statistik dan termasuk nilai yang
benar dari parameter antara batas-batasnya dengan probabilitas tinggi. Probabilitas ini cocok
untuk tingkat kepercayaan dari estimator interval. Biasanya, instilah interval kepercayaan
(atau estimasi interval) memiliki arti pengamatan interval yang dihitung dari data.
Terdapat dua metode dasar untuk membangun interval kepercayaan. Metode yang
pertama, yang berguna di beberapa aplikasi dimana terdapat parameter yang tidak diketahui.
Meliputi dari dugaan kuantitas pivot. Jumlah ini digunakan untuk menemukan variable acak
yang berupa fungsi dari perhitungan variable acak dan parameter kepentingan, namun tidak
untuk parameter lain yang tidak diketahui. Hal ini juga dibutuhkan bahwa distribusi dari
kuantitas pivot adalah bebas dari parameter yang tidak diketahui. Dalam kasus ini, parameter
lokasi skala, kuantitas pivot dapat dinyatakan dalam bentuk MLE jika ada. Pendekatan
kuantitas pivot untuk sampel besar dapat dasarkan pada hasil dari distribusi normal asimtotik
dalam beberapa kasus.
Metode lain, yang disebut metode umum, tidak memerlukan eksistensi dari kuantitas
pivot, tapi metode umum mempunyai kerugian yaitu tidak bisa digunakan saat parameter lain
menjadi kendala ada. Metode ini dapat digunakan dengan statistik, yang distribusinya dapat
ditunjukkan dalam bentuk parameter. Parameter mempunyai fungsi yang disebut dengan
persentil dan batas dari interval kepercayaan didapatkan dengan menyelesaikan persamaan
yang jelas memerlukan persentil dan statistik dari nilai yang diestimasi. Interval dari estimasi
itu sendiri didapat dengan kedua metode yang bisa diinterpertasikan dalam bentuk frekuensi
relatif dengan nilai parameter yang benar dan mencakup suatu interval, sehingga
berhubungan atau korespondensi dengan peluang, pada akhirnya interval dari estimasi akan
mencakup nilai yang benar. Bentuk suatu interval yang lain dapat didekati dengan
pendekatan Bayes. Pendekatan ini menyediakan langkah yang sesuai dalam menggunakan
informasi yang diketahui.

107

SOAL-SOAL LATIHAN

1.Berdasarkan sampel acak berukuran dari distribusi normal,


(
).
a. Jika diketahui
, tentukan
interval kepercayaan untuk berdasarkan
estimasi
dengan
.
Penyelesaian :
,
Untuk

,
interval kepercayaan,

maka

( )

)]

( )]

Sehingga diperoleh interval kepercayaan untuk


(
(
)

b. Berdasarkan pada informasi (a), tentukan batas bawah satu arah


limit
kepercayaan untuk . Juga tentukan batas atas satu arah
limit kepercayaan
untuk .
Penyelesaian :
Batas bawah satu arah
limit kepercayaan yakni
)
[l(
]
)
l( ) l (
l( )
Batas atas satu arah

limit kepercayaan yakni


)]
[
u(
u( )

)
u(
u( )
c. Untuk interval kepercayaan yang diberikan oleh ekspresi (11.2.7), memperoleh rumus
ukuran sampel wajib menghasilkan panjang spesifik dari sebuah interval. Jika
, maka apa ukuran sampel yang dibutuhkan untuk mencapai
interval
kepercayaan dengan panjang 2 ?
Penyelesaian :
Ekspresi (11.2.7) yakni
(

108

Untuk

interval kepercayaan,

maka
(
(

)
)

(
(
(

)( )

)
)
)

Jadi diperoleh ukuran sampel 25 dengan panjang 2.


d. Andaikan
tidak diketahui. Tentukan
interval kepercayaan untuk

dan
dengan
.
Penyelesaian :
,
Untuk

,
,
interval kepercayaan,

jika

maka
(

[
[
[

(
(
)

)]

)]

Sehingga diperoleh interval kepercayaan untuk


(
)
(
)
e. Berdasarkan pada data(d), tentukan
interval kepercayaan untuk
Penyelesaian :
,
,
,
Untuk
interval kepercayaan,
(
)
[
]
(

[
(

)(

109

maka

]
(

)
(

)(

]
)

Sehingga diperoleh interval kepercayaan untuk


(

(
)
( )
3.Misal
sampel acak dari distribusi eksponensial
a. Jika
dengan
, tentukan batas bawah satu arah 95 % limit
kepercayaan untuk
Penyelesaian :
Untuk
interval kepercayaan dengan
( )
[
]
l( )

)(

)
( (

)
(

))

b. Tentukan batas bawah satu arah 95 % limit kepercayaan untuk (


dimana adalah sebuah nilai arbitrary yang diketahui.
Penyelesaian :
( )
[
]
l( )

)(

( (

)
(

Untuk (

))

maka dapat diperoleh batas bawah satu arah 95 % limit

kepercayaan adalah
4.Data berikut adalah waktu (per jam) gangguan peralatan AC di bagian pesawat terbang:

Asumsikan bahwa data adalah nilai yang diamati dari sampel acak berdistribusi
( )
exponensial
a. Tentukan 90 % interval kepercayaan untuk rata-rata waktu gangguan,
Penyelesaian :
Dari data yang diberikan, dapat diperoleh

110

Untuk

interval kepercayaan,
( )
[
[
[ (

)(

( (

)
(
(

maka
( )]

)(
)

)]

))
)

( (

))]

)]

[
]
Sehingga diperoleh interval kepercayaan untuk
(
)
(
)
b. Tentukan batas bawah satu arah
limit kepercayaan untuk 10th persentil dari
distribusi waktu gangguan.
Penyelesaian :
Untuk
interval kepercayaan dengan 10th persentil maka

( )
[
]
l( )

)(

( (

)
(

))

6. Misal X1,, Xn adalah sampel acak dari distribusi Eksponensial dua parameter,
Xi~EXP(,).
a. Asumsikan diketahui = 150, tentukan kuantitas pivot untuk parameter berdasarkan
statistic kecukupan.
b. dengan menggunakan data pada Latihan 5, tentukan batas bawah 95% interval kepercayaan
untuk .
Penyelesaian:
(

a. Pdf: f(x; , ) =
= 150 sehingga f (x; ) =

Xi~EXP(,).
(

111

Xi 150 ~ EXP (,).

(
(

Jadi,

adalah kuantitas pivot.

b. Batas bawah 1 = 95% = 0,95


= 0,05
1=P[

=P[
=P[

)
(

)]

= P [578,117<]
7. Andaikan

adalah contoh acak dari distribusi Weibull

a. Tunjukkan bahwa Q =

),

b. Gunakan Q untuk mendapatkan interval kepercayaan 100 % terhadap


c. Dapatkan batas bawah limit kepercayaan 100 % untuk (

[ ( ) ]

d. Dapatkan batas atas limit kepercayaan untuk persentil ke-p dari distribusi ini
Penyelesaian :
Diketahui :
adalah contoh acak
distribusi Weibull
(
).
pdf : (
maka (
untuk (

) =
2) =

( )

untuk x > 0, dan 0 untuk x yang lain

( )

2) =

( )

a. Akan ditunjukkan bahwa Q =

( ). Telah dijelaskan di bab 8,


Jika adalah kecukupan untuk
dan juga
persentil ke- , ( ) dapat dilihat di tabel 4 (Appendix C). Dengan demikian,
[

112

)]

Jika dapat diamati, maka batas bawah satu arah


l( )

limit kepercayaan diberikan oleh

Sama halnya, batas atas satu arah

limit kepercayaan diberikan oleh

u( )

sehingga dari definisi kuantitas pivot diperoleh

Q=
Q=

(
(

) (telah ditunjukkan)

b. Menentukan interval kepercayaan 100 % terhadap dengan menggunakan Q


Q=
disini

adalah parameter skala karena Q dapat juga sama dengan

sehingga Q =

adalah kuantitas pivot


(

Anggaplah bahwa diinginkan

seperti

limit kepercayaan untuk . Jika dipilih nilai


, maka
(

)]

dengan demikian,
[

)]

)
]

Sehingga interval kepercayaan 100 % terhadap adalah

113

dan

c. Batas bawah limit kepercayaan 100 % untuk (

[ ( ) ]

)
[ ( ) ])

(
(

[ ( ) ])
[ ( ) ])

diperoleh batas bawah limit kepercayaan 100 % untuk (


(

[ ( ) ] adalah

[ ( ) ])

d. Batas atas limit kepercayaan untuk persentil ke-p


Jika
=
( ) adalah persentil ke p dari distribusi Chi-Square dengan derajat
kebebasan (

), maka

dengan daerah
[
[
[

]
]

diperoleh limit kepercayaan

dengan batas atas

9. Gunakan pendekatan pada contoh 11.3.4 jika diberikan sampel acak dari distribusi Pareto
PAR( ) dengan mengambil data dari contoh 4.6.2 yang diberikan sebagai berikut
0,85 1,08 0,35 3,28 1,24 2,58 0,02 0,13 0,22 0,52
0,02 0,13 0,22 0,35 0,52 0,85 1,08 1,24 2,58 3,28
Dapatkan interval kepercayaan 95% terhadap !

114

Penyelesaian
Diketahui
PAR( )
pdf :
( )
CDF (

)= 1 (

dengan
)

,x>0

gunakan persamaan
(

))

dalam soal ini n = 10 diperoleh


(
(
sehingga

))

( (

)) =

0,85
(

1,24

2,58

1,08

0,35

3,28

0,02

0,13

0,22

0,52

) 0,615 0,732

0,3

1,454 0,807 1,275 0,02 0,122 0,199 0,419

sehingga dengan distribusi chi-square interval kepercayan dari dari dengan daerah
0,95 adalah

= [

5,943

] =

berdasarkan tabel distribusi chi square diperoleh interval kepercayaan 95% terhadap adalah
= (0,81;2,88)
11. Andaikan adalah proporsi orang Amerika Serikat yang berambut merah.
Dalam suatu sampel berukuran 40, ditemukan 5 orang berambut merah
Dapatkan pendekatan 90% dari interval kepercayaan terhadap

115

Penyelesaian
Diketahui

adalah proporsi orang Amerika Serikat yang berambut merah

adalah orang yang berambut merah = 5


adalah ukuran sampel = 40

sehingga

(koefisien kepercayaan)

diperoleh
(
)
Jadi pendekatan 90% dari interval kepercayaan terhadap

adalah (

12. Terdapat 45 pekerja pemintalan tekstil yang dipilih secara acak untuk mempelajari tingkat
kecelakaan kerja yang terjadi. Angka kecelakaan tiap pekerja diasumsikan berdistribusi
poisson dengan mean , sedangkan nilai rata rata kecelakaan tiap pekerja adalah

a. Dapatkan pendekatan dari batas bawah sebesar 90% terhadap limit kepercayaan untuk
menggunakan persamaan 11.3.20
b. Gunakan perintah pada soal a, jika diselesaikan dengan persamaan 11.3.21

116

Penyelesaian
Diketahui : n = 45 ,
sehingga

(koefisien kepercayaan)

Angka kecelakaan tiap pekerja diasumsikan berdistribusi poisson dengan mean


pdf distribusi poisson
(

akan didapatkan dengan pendekatan sesuai persamaan 11.3.20

dan persamaan 11.3.21

( )

a. Dengan persamaan 11.3.20

Jadi
(
)
b. Dengan persamaan 11.3.21

( )

( )
(

117

Jadi

19. Diberikan sampel acak independen dari dua distribusi normal, Xi~N (
(
).
i = 1,,
kepercayaan

j=1,,

. Jika diasumsikan

100 (1 )% untuk

dan

) dan

diketahui, dapatkan interval

berdasarkan statistik kecukupan

Penyelesaian
Diketahui : Ada dua sampel acak independen berdistribusi normal
Xi~N (
),
(
).
i = 1,,

j=1,,

dan

diketahui

Akan didapatkan interval kepercayaan 100 (1 )% untuk


kecukupan
karena

dan

diketahui

<

) <

) <

118

berdasarkan statistik

dengan syarat statistik kecukupan pertidaksamaan di atas dapat diubah menjadi


(

)<

((

sehingga interval kepercayaan 100 (1 )% untuk


adalah
(

((

),

berdasarkan statistik kecukupan

))

namun yang sering dijumpai dalam persoalan, interval kepercayaan untuk

didapatkan

dengan menggunakan distribusi F Snedecor.


18. Misal X1,, Xn adalah sampel acak dari distribusi Normal, X~N(,2). Jika t adalah
bilangan asli, temukan statistic yang merupakan statistic kecukupan dan distribusi yang
bergantung pada t, ,2 hanya jika F(t; ,2) = P (Xt)
Penyelesaian:
Parameter skala lokasinya f(x; ,2)= F0(

Misal :
(

c 2 =
t = c 2
jika dan adalah MLE dari

dan 2 yang mana bergantung pada t, ,2

F(t; ,2) = P(X t)

F0 = ( )
F0 = (
F0 = (

)
)

Yang mana adalah fungsi dari c dan kuantitas pivot untuk dan untuk 2 yang bergantung
pada F(t; ,2) = P(X t)

119

BAB XII
UJI HIPOTESIS

12.1 PENDAHULUAN
Dalam kegiatan ilmiah, banyak perhatian yang ditujukan untuk menjawab pertanyaan
tentang kevalidan teori atau hipotesis tentang fenomena fisik. Apakah obat yang baru
efektif?. Biasanya, informasi tentang fenomena tersebut hanya dapat diperoleh dengan
menunjukkan percobaan yang hasilnya mempunyai beberapa langkah dalam menarik
hipotesis. Syarat uji hipotesis akan mengacu pada proses mencoba untuk memutuskan benar
atau salah hipotesis tersebut berdasarkan bukti eksperimen.
Misalnya, diduga bahwa suatu hipotesis tertentu, mungkin sebuah teori yang diterima,
adalah salah, dan dilakukan percobaan. Hasil yang tidak konsisten dengan hipotesis akan
meragukan kevalidannya. Misalnya, hipotesis yang akan diuji dapat menentukan bahwa suatu
konstanta fisika memiliki nilai . Pada umumnya pengukuran eksperimen berdasarkan pada
kesalahan acak, dengan demikian keputusan tentang benar atau salah dari hipotesis,
berdasarkan pada bukti eksperimen, juga berdasarkan pada kesalahan. Tidak akan mungkin
untuk menghindari kesalahan keputusan, tetapi akan mungkin untuk membuat uji kesalahan
tersebut jarang terjadi.
contoh 12.1.1 menggambarkan konsep uji hipotesis
Sebuah teori mengemukakan bahwa hasil dari suatu reaksi kimia berdistribusi normal ,
(
). Percobaan sebelumnya menunjukkan bahwa
jika mineral tertentu tidak
diberikan, dan
jika mineral diberikan. Percobaan akan mengambil dari sampel acak
berukuran . Dalam dasar dari sampel tersebut, akan coba diputuskan mana kasus yang
benar. Hal ini ingin di uji menggunakan hipotesis nol
dengan
hipotesis alternatif
Definisi 12.1.1
(
), hipotesis statistik adalah pernyataan tentang distribusi . Jika hipotesis
Jika
), maka disebut sebagai hipotesis sederhana,
tersebut ditetapkan dengan lengkap (
dengan kata lain disebut komposit.
Sebuah hipotesis statistik subset dari ruang parameter. Tujuan dari Uji akan memutuskan
apakah nilai sebenarnya dari parameter. Demikian, hipotesis nol subset
dari dan
{ } dan { },
hipotesis alternatif, . Dalam kasus hipotesis sederhana,
dimana
. Kebanyakan percobaan atau penelitian hipotesis mempunyai beberapa
tujuan yang salah satu harapannya untuk mendukung hipotesis alternatif dengan bukti
statistik. Pada contoh 12.1.1, jika ada bukti kuat bahwa mineral diberikan, maka
dimungkinkan akan menghabiskan sejumlah besar uang untuk memulai pertambangan, jadi
kasus ini diselesaikan dengan hipotesis alternatif. Sekarang harus mempertimbangkan data
sampel, dan memutuskan berdasarkan data apakah ada bukti kecukupan Statistik untuk
menolak
, mendukung alternatif
atau tidak ada bukti yang cukup. Caranya adalah

120

dengan membagi ruang sampel menjadi dua daerah, "daerah kritis" atau " daerah penolakan"
, dan daerah penerimaan
. Jika data sampel yang diamati jatuh pada , maka akan
menolak
dan jika tidak jatuh pada , maka menerima .
Definisi 12.1.2
daerah kritis untuk uji hipotesis adalah himpunan bagian dari ruang sampel yang sesuai
untuk menolak hipotesis nol
Pada contoh , adalah statistik kecukupan untuk , menyatakan daerah kritis secara
langsung dengan syarat variabel tunggal , sebagai uji statistik. Karena
, bukti
{(
)
}, untuk
langsung untuk daerah kritis pada masalah ini diberikan
beberapa konstan c. Akan menolak
jika
, dan akan menerima
jika
.
Terdapat dua kemungkinan kesalahan yaitu akan menolak
ketika
benar, atau menolak
ketika
salah. Kesalahan-kesalahan itu adalah:
1. Kesalahan tipe I : menolak kebenaran
2. Kesalahan tipe II : menerima
padahal
salah.
Diharapkan untuk memilih statistik uji dan daerah kritis agar dua tipe kesalahan di atas
memiliki peluang kecil, ada dua peluang yaitu:
]
[ ]
1. [
]
[ ]
2. [

,
Gambar 12.1. Peluang kesalahan tipe I dan tipe II
Definisi 12.1.3
[ ]
Untuk hipotesis nol ( ) sederhana, peluang untuk menolak kebenaran
,
sebagai tingkat kepercayaan dari sebuah Uji. Untuk hipotesis nol( ) komposit, ukuran
dari Uji (atau ukuran dari daerah kritis) adalah peluang maksimum untuk menolak
ketika
benar (nilai terbesar dari parameter dibawah ).

121

Pada
sederhana tingkat kepercayaan juga merupakan ukuran Uji.
Pendekatan standar digunakan untuk menunjuk atau memilih tipe kesalahan, misalkan
memilih antara
atau
, yang akan digunakan sebagai nilai kepercayaan dari
Uji, kemudian nilai ini digunakan untuk menentukan daerah kritis. Diantara semua daerah
kritis akan dipilih satu yang paling kecil [ ].
Secara umum, diharapkan melakukan Uji terhadap
dengan
(dimana
) pada tingkat kepercayaan dengan [ ]
. Uji berdasarkan pada statistic uji

(12.1.1)

Ekuivalen dengan menggunakan , jadi dapat ditunjukkan dengan tepat uji untuk menolak
jika
, dimana
merupakan nilai perhitungan dari , dengan batasan
,
[
]
, dan mempunyai daerah kritis sebesar . Peluang dari kesalahan tipe II
untuk alternative adalah
[

[
[

sehingga
[

Sampel berukuran

(12.1.2)

yang akan memberikan nilai [

adalah penyelesaian untuk


(12.1.3)

Diberikan

)
(

(
)

(
(

)
(

(12.1.4)

Pada contoh 12.1.1 untuk


Di peroleh

) (

Definisi 12.1.4
Fungsi kuasa, ( ), dari Uji
parameter adalah .

adalah peluang penolakan

122

ketika nilai sebenarnya dari

Untuk hipotesis sederhana


dengan
, mempunyai nilai ( )
[ ]
[ ]
dan ( )
. Untuk hipotesis komposit, katakan
dengan
, ukuran dari Uji (atau daerah kritis) adalah
( )
(12.1.5)
[ ], sehingga [ ]
Jika nilai sebenarnya
berada di
, maka ( )
bergantung pada . Dengan kata lain, nilai fungsi kuasa selalu berada di bawah area pdf uji
statistik dan di luar daerah kritis. Diberikan nilai [ ] untuk pada hypothesis nol dan nilai
[ ] untuk pada hypothesis alternatif.

Gambar 12.2. Hubungan fungsi kuasa dengan peluang kesalahan tipe II.
12.2 Hipotesis Komposit
(
), dengan
Diketahui
diketahui, diharapkan uji
dengan
alternative komposit
. Pada contoh sebelumnya bahwa daerah kritis diletakkan
di arah kanan untuk alternatif yang lain
, tetapi nilai dari nilai kritis c tidak
bergantung pada nilai
. Jadi, jelas bahwa uji alternatif sederhana juga benar untuk
alternatif komposit ini. Uji tingkat kepercayaan akan menolak
jika

(12.2.1)

uji kuasa untuk nilai

yang lain adalah


( )

| ]

Sehingga
( )

(12.2.2)

( )
Untuk
, ada
dilakukan uji
(12.2.1) dipenuhi. Berikut merupakan uji
menolak
untuk
adalah ( )

123

( )
[
]. Andaikan
. Akan menolak
jika pertidaksamaan
untuk hipotesis nol komposit. Peluang
( )
( )
, dengan

demikian

( )

. Jadi, jika daerah kritis dipilih untuk nilai

pada

, maka

kesalahan Type I akan kurang dari untuk semua


. Jadi, uji yang sering
dikembangkan untuk hipotesis nol sederhana dapat digunakan untuk hipotesis komposit dan
P[TI] tidak akan kurang dari . Bentuk umum dari fungsi kuasa ditunjukkan pada gambar
12.3 untuk n = 20 dan 100.

Gambar 12.3 uji perbandingan fungsi kuasa saat dua ukuran sampel berbeda.
Dari gambar 12.3, lebih jelas mengapa kegagalan menolak
seharusnya tidak
ditafsirkan sebagai penerimaan
. Pada kenyataannya, dapat ditemukan suatu nilai
alternatif kecukupan untuk
, sehingga uji kuasanya, (), tidak berubah-ubah untuk .
Pada khususnya ini tidak akan menjadi menjadi masalah yang serius jika dapat menentukan
daerah yang diabaikan, yang mana merupakan subset alternatif untuk uji kuasa kecil. Dengan
kata lain, tidak terlalu penting mendapatkan nilai yang cocok untuk
. Pada contoh, tidak
terlalu diperhatikan tentang penolakan
saat berada pada interval yang kecil, misalkan
(
), dapat diambil sebagai daerah yang diabaikan. Saat , ukuran sample dapat
ditentukan dari persamaan (12.1.4) yang akan memberikan nilai kuasa ( )
. Jadi,
untuk nilai alternatif yang berada di luar daerah yang diabaikan, suatu uji dapat dibangun
hingga mencapai atau melebihi perbandingan kesalahan yang sudah ditentukan untuk kedua
tipe kesalahan.
NILAI-P
Tidak ada perjanjian tentang bagaimana yang kecil digunakan untuk menolak
sebagai bukti yang kuat dalam mendukung
. Percobaan 1 akan mempertimbangkan =
0.05, sementara percobaan 2 menggunakan = 0.01. Jadi, ada kemungkinan untuk menolak
percobaan 1 saat percobaan 2 diterima. Uji nilai-p, didefinisikan sebagai ukuran terkecil
yang dapat menolak , berdasarkan nilai yang diamati dari uji statistik.
Contoh 12.2.1
Berdasarkan pada ukuran sample
dari distribusi normal,
(
), ingin uji
|
dengan
. diketahui
. Nilai-p adalah [
]
(
)
. Karena
, Uji akan
ditolak saat
0.05 dan diterima saat
0.01.

124

Untuk uji

, akan menolak

jika

(12.2.3)
Jadi, daerah kritis dari sekarang diambil dari arah kiri distribusi uji stastistik. Uji hipotesis
tersebut adalah uji satu arah. Uji dengan daerah kritis dari bentuk (12.2.1) disebut uji satu
arah batas atas dan bentuk (12.2.3) disebut uji satu arah batas bawah.
Tipe lainnya adalah uji alternatif dua arah. Akan uji
dengan alternatif
. Jika memilih arah kanan dari daerah kritis, maka akan mempunyai kuasa bagus untuk
menolak
saat
, tapi kuasanya akan lemah saat
. Sama halnya jika dipilih
arah kiri dari daerah kritis, maka kuasanya akan bagus jika
, tapi kuasanya akan
lemah jika
. cara yang baik adalah menggunkan uji dua arah dari daerah kritis dan
menolak
jika
(12.2.4)

Dalam kasus ini masuk akal untuk menggunakan uji equal-tailed (masingmasing arah berukuran ) karena pertimbangan simetri. Fungsi kuasa untuk uji dua-arah
adalah
( )
[

| ]
Diberikan
( )

(12.2.5)

Jika
, maka seperti pada gambar 12.4 , peluang normal fungsi kuasa di atas akan
mendekati nol. Sama halnya, jika
, maka satu yang tidak akan diharapkan untuk
menolak
dengan mendapatkan besar, dan peluang normal akan mendekati nol. Rumus
ukuran sample untuk uji dua arah
diberikan oleh persamaan (12.1.4) dengan
.

Gambar 12.4 Daerah kritis untuk uji dua arah.


Dalam hal ini, mudah untuk mengamati suatu hubungan antara selang kepercayaan dan
uji hipotesis. Pada uji dua arah di atas, ditentukan untuk suatu nilai pengamatan yang mana
nilai uji hipotesis dari
tidak akan ditolak. Dari persamaan (12.2.4) nilai
yang memenuhi
adalah

(12.2.6)

125

Jadi, nilai
berada dalam daerah penerimaan ( daerah yang tidak ditolak)
dengan selang kepercayaan (1-) 100% untuk .
12.3. Uji Hipotesis untuk Distribusi Normal
Uji Rata Rata ( Diketahui)
Teorema 12.3.1
Andaikan bahwa
adalah sampel acak teramati dari
dan diberikan uji statitik sebaai berikut

) dengan

diketahui,
(12.3.1)

Untuk menguji H0 ada 3 kemungkinan menolak H0, yakni:


1. Dengan tingkat kepercayaan
untuk menguji
menolak
jika
. Fungsi kuasa untuk uji ini adalah
( )

dengan

,
(12.3.2)

2. Dengan tingkat kepercayaan


untuk menguji
dengan
menolak
jika
. Fungsi kuasa untuk uji ini adalah
( )

(12.3.3)

3. Dengan tingkat kepercayaan


untuk menguji
menolak
jika
atau
.
Besar sampel yang dibutuhkan untuk mencapai tingkat kepercayaan
untuk nilai alternatif diberikan oleh
(

)
(

dengan

dengan kuasa

(12.3.4)

untuk uji satu arah, dan


(

)
(

(12.3.5)

untuk uji dua arah.


Uji Rata-Rata ( Tidak Diketahui)
Uji untuk dengan tidak diketahui, menggunakan distribusi t-Students yang caranya sama
dengan uji statistik normal standar untuk kasus variansi diketahui, dengan
diganti oleh
2
variansi sampel teramati s . Digunakan distribusi t karena jumlah sampel kecil (n<30).
Teorema 12.3.2
),
Diberikan
adalah sampel acak dari (
tidak diketahui dan diberikan uji
statistik sebagai berikut

(12.3.6)

Untuk menguji H0 ada 3 kemungkinan menolak H0, yakni:


1. Dengan tingkat kepercayaan untuk menguji
dengan
(
).
jika
2. Dengan tingkat kepercayaan untuk menguji
dengan
(
).
jika

126

, menolak
, menolak

3. Dengan tingkat kepercayaan


jika
atau

untuk menguji
.

Untuk nomer 1 dari teorema,


( )

, menolak

, fungsi kuasanya adalah


( )| ]

dengan

;v=(n-1)

( )| ]

sehingga
( )

( )],

(12.3.7)

) ,
( ) dan
dimana
,
dan
saling bebas,
(
(
)
( ). Variabel acak dalam persamaan (12.3.7) mempunyai distribusi
noncentral t dengan derajat kebebasan dan parameter noncentrality . Menggunakan
distribusi t - Students ketika
.
Contoh 12.3.1
Dengan tingkat kepercayaan
, akan diuji
dengan
untuk
distribusi normal, (
) dengan
tidak diketahui, diinginkan mempunyai kuasa 0,99
jika nilai
sebenarnya adalah dua standar deviasi lebih besar dari
. Tentukan besar
sampel!
Pada soal telah diketahui
( )=
untuk
|
|
. Dari Tabel 8 (Lampiran C), didapat
.
Uji Untuk Variansi
Uji hipotesis
dengan
berdasar pada uji statistik
(
)
(12.3.8)
(
) saat
benar. Nilai teramati dari variansi sampel, , relatif besar dari
yang dapat mendukung . Disarankan memilih arah kanan dari distribusi
sebagai daerah
kritis untuk setiap Uji. Uji ini berguna untuk memutuskan ketika populasi berukuran besar.
Untuk hipotesis null komposit menggunakan hipotesis berbentuk
.
( ) adalah CDF dari ( ).
Teorema 12.3.3
), dan diberikan uji statistik;
Diberikan
adalah sampel acak dari (
(
)
(12.3.9)
Ada 3 kemungkinan menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
(
). Fungsi kuasa untuk uji ini adalah
jika
( )
[( )
(
)
]
(12.3.10)
2. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
(
). Fungsi kuasa untuk uji ini adalah
jika
( )
[( ) (
)
]
(12.3.11)
3. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
(
) atau
(
).
jika

127

Bukti
Mendapatkan fungsi kuasa untuk kemungkinan nomor 1
( )
(
)| ]
= [
)
( )
(
)| ]
= [(
[( )
(
)
]
=
( )
[
(
)
]
(
)
, karena ( ) bertambah, ukuran
daerah kritis adalah .
Sebagai latihan, sangat tepat menggunakan uji dua arah untuk mendapatkan fungsi kuasa
bagian 3, tapi untuk nilai
dan
yang berbeda, dengan
.
Terdapat kemungkinan mendapatkan ukuran sampel untuk uji ini. Sebagai contoh, untuk uji
bagian 1, ingin didapat ( )
untuk
. Hal ini membutuhkan nilai
sehingga
( )
(
)
(
)
(12.3.12)
Persamaan ini tidak dapat diselesaikan secara eksplisit untuk , tetapi aturan iterasi
berdasarkan percentile pada Tabel 4 (Lampiran C) dapat digunakan untuk mencari nilai
khusus , , dan . Hal ini juga diinginkan untuk mendapat rumus pendekatan yang
memberikan
secara eksplisit sebagai fungsi dari nilai
. Seperti pendekatan yang
berdasarkan pada pendekatan normal ( )
, dimana telah diberikan di bab 8.
Jika pendekatan jumlah sampel ini digunakan uji dua arah dari persamaan (12.3.12), maka hal
ini mungkin untuk mendapat pendekatan
(

(12.3.13)

Contoh 12.3.2
Ingin uji

dengan
,
untuk
dan kuasa
adalah benar. Berdasarkan pendekatan (12.3.13) dengan
,
, dan ( )
didapat
. Jika dihitung kedua arah persamaan

(12.3.12) untuk nilai


, didapat keputusan baik saat
, dimana sesuai
dengan
.
Uji Dua Sampel

Kemungkinkan untuk uji hipotesis variansi dari dua distribusi normal, andaikan
, digunakan uji statistik F sebagai berikut:
(12.3.14)
(
dimana
Teorema 12.3.4
Andaikan
(
) dan (

) jika

benar.

dan
adalah nilai teramati sampel acak saling bebas dari
), berturut-turut, dan diberikan uji statistikya sebaga berikut:

(12.3.15)
Ada 3 kemungkinan menolak H0, yakni:

128

1. Dengan tingkat kepercayaan untuk menguji


dengan

(
).
menolak
jika

2. Dengan tingkat kepercayaan untuk menguji


dengan

(
).
menolak
jika

3. Dengan tingkat kepercayaan untuk menguji


dengan

(
) atau menolak

menolak
jika
jika
).
Jika variansi tidak diketahui tapi bernilai sama, maka uji hipotesis rata-rata
dapat dicari menggunakan distribusi t. Diberikan oleh

,
,
,
(

(12.3.16)

dimana

didefinisikan oleh persamaan (11.5.7).

Teorema 12.3.5
Andaikan
dan
adalah nilai sampel acak saling bebas dari dua populasi
) dan (
), dimana
yang berdistribusi normal, masing-masing (
.
Berikut ini ada 3 kemungkinan untuk menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika
(
).
2. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika
(
).
3. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika
(
). atau
(
).
Fungsi kuasa untuk uji ini menggunakan distribusi noncentral t. Hal ini mungkin untuk
menentukan sampel yang besarnya sama
untuk uji
satu arah dengan kuasa
|
| . Untuk uji dua arah,
menggunakan Tabel 8 (Lampiran C) dengan
besarnya adalah .
variansi yang berbeda, pendekatan uji dapat dilakukan berdasarkan pendekatan statistik t
Welch yang diberikan oleh persamaan (11.5.13).
Uji Sampel Berpasangan t
) (
), yang saling bebas
Diasumsikan data berpasangan dari populasi bivariate, (
(
), dengan
( )
( )
dan selisihnya
berdistribusi normal,
. Satu kemungkinan yang pasti untuk kasus ini adalah jika pasangan tersebut sampel
acak dari populasi normal bivariate. Jika pasangannya saling bebas dan masing-masing
mempunyai distribusi normal bivariate yang sama, maka selisihnya adalah normal saling
bebas dengan rata-rata
. Oleh karena itu, uji berdasarkan variabel T dari persamaan
(11.5.17) digunakan untuk selisih
dari
dengan
tidak diketahui.
Teorema 12.3.6
)
(
) nilai dari
Diketahui (
pasangan variable acak saling bebas,
(
)
(
), dan selisihnya
berdistribusi normal, dengan rata-rata

129

dan variansi
sampel dari selisih

. Diberikan
, untuk

dan

adalah rata-rata sampel dan variansi


, dan diberikan

(12.3.17)

Berikut ini ada 3 kemuninan untuk menolak H0, yakni:


1. Dengan tingkat kepercayaan untuk menguji
, menolak
jika
(
).
2. Dengan tingkat kepercayaan untuk menguji
, menolak
jika
(
).
3. Dengan tingkat kepercayaan untuk menguji
, menolak
jika
(
). atau
(

dengan
dengan
dengan
).

12.4 UJI BINOMIAL


( )
Andaikan
, uji untuk p akan didasarkan pada kecukupan statistik

(
).
Teorema 12.4.1
Diberikan
(
), untuk n ada 3 kemungkinan untuk menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika

2. Dengan tingkat kepercayaan


jika
3. Dengan tingkat kepercayaan
jika

Ketika
, didapat

(
)

untuk menguji

, menolak

untuk menguji

, menolak

( )
(
)

Seperti pada contoh uji satu arah, kemungkinan untuk menolak


akan kurang dari untuk
nilai p yang lain pada hipotesisnol.
Teorema 12.4.2
(
)
Andaikan
(
) merupakan CDF binomial. Nilai S yang diamati
ditunjukkan oleh s .
Ada 3 kemungkinan menolak H0, yakni:
1. Dengan tingkat kepercayaan yang konservatif untuk menguji
, menolak
jika
(
)
2. Dengan tingkat kepercayaan yang konservatif untuk menguji
, menolak
jika
(
)

130

3. Uji dua sisi yang konservatif untuk menguji


jika
(
)

, menolak
(

Konsep dari uji hipotesisdapat dijelaskan dengan model berikut. Jika kasus pertama adalah
uji
ditolak jika s yang diamati kecil dan tidak mungkin () saat
. jadi daerah kritis mempunyai ukuran .
)
Pada kasus 2 jika menjadi nilai yg diuji maka (
, ujinya akan mempunyai
tingkat kepercayaan ; sebaliknya, disebut konservatif.
(
)
Untuk uji hipotesisdari dua populasi,andaikan X
(
), X dan Y

.
independen.
MLEnya
adalah

,
(
)(
). Jika
maka

( )
(
) (
)
Dengan tingkat kepercayaan untuk menguji
menolak

dengan

12.5 UJI POISSON


Uji rata-rata dari distribusi poisson dapat ditulis
(
)
( ).
Teorema 12.5.1
( )
Diberikan
sampel acak dari

akan

. Pada teorema berikut ini,

.
Ada

kemungkinan menolak H0, yakni:


1. Dengan tingkat kepercayaan yang konservatif untuk menguji
(
)
2. Dengan tingkat kepercayaan yang konservatif untuk menguji
(
)
.
3. Uji dua arah ukuran dari H0 :
sedangkan
2n
(2s) atau 2n
(2s+2).

akan menolak H0 jika

Dengan menggunakan hasil pada latihan 18 bab 8 ada kemungkinan untuk uji chi-square
percentil. H0 bagian 1 ditolak jika 2n
(2s) dan H0 bagian 2 ditolak jika
2n
(2s+2).
12.6 UJI KUASA
Diberikan
mempunyai pdf
korespondensi untuk C adalah
( )

) dan daerah kritis C. Fungsi kuasa

[(

131

Definisi 12.6.1
Uji dari
dengan
yang didasarkan pada daerah kritis C* dikatakan
sebagai uji kuasa dengan tingkat kepercayaan jika
( )
1.
, dan
( ) untuk sembarang daerah kritis C dari ukuran [ ( )
]
2.
( )
Daerah kritis, C*, disebut uji kuasa dengan tingkat kepercayaan .
Teorema berikut ini menunjukkan bagaimana mendapatkan
hipotesissederhana.
Teorema 12.6.1 Lemma Neyman-Paerson
Misalkan
mempunyai pdf (
(

uji

BUKTI :
Untuk membuktikan, ambil notasi vektor,
adalah sebuah kejadian dimensi ke-n, diberikan
| ]

dari

uji

). Diberikan
(
(

)
)

dan
)| (
)
}
C* = {(
dimana k adalah konstanta, sehingga
[(
)
| ]
Maka C* adalah uji kuasa dengan tingkat kepercayaan untuk menguji

kuasa

) dan

dengan

). Jika A

Untuk kasus kontinu. Untuk diskrit caranya sama, dengan mengganti integral. Akan
digabungkan komplemen dari himpunan C oleh . Dengan catatan bahwa jika A adalah
subset dari C*, maka
[
| ]
[
| ]
karena

). Begitu juga, jika A adalah sebuah subset dari , maka

[
| ]
[
| ]
Perhatikan bahwa dari sembarang daerah kritis C didapatkan
)dan
)
(
) (
(
) (
Selanjutnya,
( )
[
| ]
[
dan
( )
[
| ]
[
Dan selisihnya adalah
| ]
( )
( )
[
[

132

| ]
| ]
| ]

Kombinasi persamaan
( )
Dengan
dan

( )

| ]

| ]

| ]

| ]

| ]

| ]

dan
didapat
( )

( )

| ]

| ]

sehingga
( )

( )
dengan

| ]

( ){ [

| ]}

pada sisi kanan dari pertidaksamaan ini, didapatkan


( )

( )

( )[

( )]

( )

( )
( )
Jika C adalah daerah kritis dari , maka
, maka sisi kanan
( )
( )
dari pertidaksamaan adalah 0, selanjutnya
Filsafat umum dari Neyman-Pearson untuk uji hipotesis adalah mengambil nilai sampel ke
dalam daerah kritis. Faktanya, lemma Neyman-Pearson menyatakan bahwa kriteria untuk
memilih nilai sampel berdasarkan pada besarnya rasio dari fungsi likelihood dari
dan .
Contoh 12.6.1
( ). Akan menguji
Diketahui sample acak berukuran n dari distribusi eksponensial
dengan
dimana
.
Lemma Neyman-Pearson menyatakan menolak
jika
(
)
(
)
(
)
)
]
dimana k adalah [ (
, batas bawah
.Sehingga
[ (

| ]

((

)| ]

jadi,
[
dimana

((

karena (

= {(
(

| ]

)/(

| ]

). Perhatikan bahwa pada pertidaksamaan berubah

pada kasus ini. Sehingga, uji kuasa daerah kritis mempunyai bentuk C*

)|
}. Perhatikan bahwa batas bawah
,dipunyai
), jadi bahwa
( )
akan memberi daerah kritis pada tingkat

kepercayaan , dan uji ekuivalen akan menolak


Sama halnya, jika ingin menguji
kuasa dengan tingkat kepercayaan ,
dua uji ini adalah tanda dari (

jika

dengan
jika

).

dengan
, maka uji
( ). Perbedaan antara

) pada dua kasus yang berbeda. Dengan kata lain, pada

133

sisi kanan sebuah persamaan [

| ]

| ] menjadi [

, yang mana korespondensi untuk (

| ] jika

. Catatan bahwa cara ini berlaku

untuk C* bergantung pada hipotesisalternatif. Begitu juga, uji kuasa dari


dengan
adalah sama.
Contoh 12.6.2
Diketahui sampel acak berukuran n dari distribusi normal dengan rata-rata nol,
Akan diuji
dengan
dengan
. Pada kasus ini,

Selanjutnya,

).

ekuivalensi terhadap
(

untuk konstanta

. Karena

{(
)|
bentuk
, akan menolak
jika
kuasa dari tingkat kepercayaan

, dipunyai

, dan uji kuasa mempunyai

}. Perhatikan juga bahwa


( ) kurang dari
( ). Dengan catatan bahwa jika
, uji
( ).
akan ditolak jika

Contoh 12.6.3
Dapatkan uji kuasa dari
(
). Didapatkan :

dengan

berdasarkan pada statistik

( )

( )

sehingga
(
(

)
}
)

atau
[
Karena

(
(

)
]
)

, saat log negatif dan uji

jika

. Sekarang

[
|
]
(
)
jadi, untuk nilai integral i = 1, ., n, uji kuasa dari tingkat kepercayaan , menolak
jika
. Untuk menentukan tingkat kepercayaan , uji akan memilih konservasi seperti
pembahasan di awal.
Contoh12.6.4
( ).
Diberikan sample acak berukuran n, akan diuji
( ) dengan
Didapatkan :

134

(
(

)
)
Jadi,
ditolak jika
. Dari teorema limit dapat digunakan untuk
( )
mendapatkan pendekatan nilai kritis. Diketahui jika
( ),maka
( )

, dan

Demikian, pendekatan tingkat kepercayaan

pada uji akan menolak

jika

(
)

Konsep uji kuasa akan diperluas pada kasus hipotesiskomposit.


12.7 UJI KESERAGAMAN KUASA (UMP)
Di bagian terakhir, dapat dilihat bahwa dalam beberapa kasus pengujian yang sama
terdapat uji kuasa terhadap nilai-nilai alternative yang berbeda. Jika dalam uji tersebut
terdapat uji kuasa untuk menolak setiap nilai yang mungkin dalam hipotesis alternative
komposit, maka uji tersebut dinamakan uji keseragaman kuasa
Definisi 12.7.1
Diberikan ,: mempunyai pdf bersama f( , ; ) untuk
dan H0 :

sedangkan
:
- o, dimana o subset dari . A adalah daerah kritis , disebut
keseragaman kuasa (UMP) dengan tingkat kepercayaan jika :
( )
dan
() ()
Untuk semua
- o dan semua daerah kritis C dengan tingkat kepercayaan .
Hal itu menunjukkan
didefinisikan uji UMP untuk tingkat kepercayaan jika mempunyai
nilai , dan jika untuk semua nilai parameter , mempunyai nilai maksimum kuasa relative
untuk semua daerah kritis dari tingkat kepercayaan
Contoh 12.7.1
Diberikan sampel acak dengan ukuran n dari distribusi eksponensial, ~ EXP ().
Seperti pada contoh 12.6.1 bahwa uji kuasa dengan tingkat kepercayaan H0 : = 0 dengan
: = 1 ketika 0 >1 untuk menolak H0 jika 2n / 0 = 2 / 1
(2n). karena tidak
bergantung pada nilai particular dari 1 , tetapi kenyataanya bahwa 1> 0 itu menunjukkan
bahwa uji UMP dari H0 : = 0 dengan H : > 0.
Catatan juga bahwa fungsi kuasa untuk uji ini bisa di ekspresikan dengan syarat CDF chi
square, H(c;v) dengan v = 2n.
() = 1 H [(0 / )
(2n) ; 2n]
bernilai (0 / )[2 / 0] = 2 / 0 ~ X2 (2n) ketika bernilai benar . karena () adalah
fungsi naik dari , max () = ( 0) = disebut uji UMP dengan tingkat kepercayaan
untuk hipotesis komposit H0: 0 dengan H: > 0

135

Sama halnya dengan uji UMP dari: =


(2n). dan fungsi kuasanya adalah
() = H [(0 / ) (2n) ; 2n]

dengan H: <

0,

menolak H0 jika 2n / 0

Definisi 12.7.2
Pdf bersama f(x; ) dikatakan mempunyai monoton likelihood ratio (MLR) pada statistik
)
T=t(X) jika terdapat dua atau lebih nilai dari parameter
,rasio nya (
(
) bergantung pada x melalui fungsi t(x), dan rasio ini bukan penurunan fungsi dari
t(x).
Contoh 12.7.2
Diberikan sample acak ukuran n dari distribusi eksponensial, Xi EXP( ).
(
)=(1/ )n exp (-
) dan
(
)
( )
[ (
) ]
(
)
Dimana sample acak ini tidak bergantung pada fungsi t(x)= jika
Sehingga f(x; )
mempunyai penyelesaian MLR dalam statistik T=
MLR juga berlaku pada statistik ,
karena merupakan peningkatan fungsi dari T. MLR bisa digunakan dalam pengujian UMP.
Teorema 12.7.1
Jika pdf bersama f(x; ) mempunyai rasio monoton likehood T = t(X), maka uji UMP dengan
ukuran untuk H0 : dengan H : > 0 , menolak H0 jika t(X) k dimana P[t(X)k 0]
=
Untuk menguji H0 : 0 dengan
: < 0 juga bisa diselesaikan dengan pendekatan MLR
tetapi tidak sesuai dengan teorema 12.7.1.
Contoh 12.7.3
Di berikan sampel acak dengan ukuran n dari dua parameter distribusi eksponensial
( ). Pdf bersama :
~
[ (
)]
( ){
Jika

1 < 2, maka

(
)
{
[ (
]
(
)
Fungsi diatas tidak bisa berlaku untuk
, tetapi tidak menjadi masalah, sebab
P[
] = 0 ketika merupakan nilai benar dari . Selanjutnya rasio bukan fungsi naik
dari
dan MLRnya
. Menurut teorema 12.7.1 uji UMP dengan tingkat
kepercayaan untuk menguji
dengan
menolak
jika
[
[ (
)]. Didapat
dimana
| ]
(
)
Teorema 12.7.2
Diberikan ,, mempunyai pdf bersama :
F(x;) = c ()h(x)exp[q()t(x)]
Dimana q() adalah fungsi naik dari

136

Ada 2 kemungkinan menolak H0, yakni:


1. Suatu uji UMP dengan tingkat kepercayaan untuk menguji H0 : 0 dengan
> 0 , menolak H0 jika t(x)k, dimana P[t(X) k | 0] =
2. Suatu uji UMP dengan tingkat kepercayaan untuk menguji H0 : 0 dengan
< 0 , menolak H0 jika t(x) k, dimana P[t(X) k| 0] =
Bukti :
Jika 1< 2, maka q( 1) < ( 2) sehingga
(
)
( )
{[ ( )
( ) ( )]}
(
)
( )
Fungsi diatas merupakan fungsi naik dari t(x) karena ( )
( )>0.Teorema ini
mengikuti kriteria MLR.
Contoh 12.7.4
Diberikan sampel acak dengan ukuran n dari distribusi poisson
(

)=

:
:

( )..pdf bersama

untuk semua

=
(
) exp [(ln ) ]
diketahui q( ) = ln ( ) dan t() = . Uji UMP dengan tingkat kepercayaan untuk H0 :
: < 0 akan menolak H0 jika T = k dimana P[T k]= .
0 dengan
Karena T ~ POI (n ) , harus mendapatkan

(
)((
)t/t! =
Terdapat masalah diskrit, tetapi uji yang di jelaskan pada theorem 12.7.2 ini merupakan uji
UMP untuk nilai-nilai tertentu yang dapat dicapai.
UJI UNBIASED
Disebutkan sebelumnya bahwa dalam beberapa kasus pengujian UMP mungkin tidak ada,
khususnya untuk alternatif dua sisi, mungkin ada pengujian UMP antara kelas terbatas yaitu
pengujian "unbiased"
DEFINISI 12.7.3
Pengujian dari Ho : o dengan

- o adalah unbiased jika


( )

DEFINISI 12.7.3
Pengujian dari Ho : o sedangkan H :
min () max ()
-o

( )

- o adalah unbiased jika

Dengan kata lain kemungkinan Ho ditolak bernilai salah ketika minimum dan kemungkinan
Ho ditolak bernilai benar ketika maksimum.

137

Contoh 12.7.5
).
sampel acak dengan ukuran n dari distribusi normal dengan mean nol,
~ (
Diinginkan untuk menguji Ho=
=
dengan,
:
berdasarkan statistic uji
=

. Ho diketahui bahwa ~ (n).jadi untuk uji dua arah daerah kritis sama dengan
bagian 3 dari theorem 12.3.3, akan menolak Ho jika
(n). dengan kata lain, sampel
dengan ukuran n = 2 dan tingkat kepercayan
untuk uji ini diberikan dalam gambar 12.5

= 0.05 untuk Ho:

= 1. Grafik fungsi kuasa

Nilai minimum dari ( ) tergantung pada nilai


, sehingga pengujian sangat
lemah untuk menolak Ho untuk beberapa nilai
dibandingkan ketika
.
Konsekuensinya adalah uji ini tidak unbiased. Hal itu memungkinkan untuk membangun uji
unbiased dua arah jika mengabaikan kesamaan uji ua arah dengan memilih satu bagian dari
nilai kritis (n) dan
(n) dengan +
= tetapi
(lihat latihan 26).
Dapat ditunjukkan bahwa uji dideskripsikan atas uji UMP diantara kelas terbatas dari uji
unbiased H0.Kenyataanya , di tunjukkan bahwa itu bias, dalam kondisi tertentu untuk pdf
bersama yang diberikan pada persamaan 12.7.5, keseragaman uji kuasa (UMPU) dari H0: =
0 sedangkan
: 0 ada . metode untuk penurunan uji UMPU diberikan oleh Lehmann
(1959), tetapi tidak dibahas disini.
12.8 UJI GENERALIZED LIKELIHOOD RATIO (UJI GLR)
Uji GLR merupakan perluasan dari uji Neyman-Pearson.
Definisi 12.8.1
Misalkan X = (X1 , , Xn) dimana X1 , , Xn memiliki pdf bersama f(x;) untuk
Dengan Hipotesis:
H0 : 0
: - 0
Maka, generalized likelihood ratio (GLR) didefinisikan dengan

138

( )

Dimana menunjukkan MLE biasa dari , dan menunjukkan MLE dengan batasan bahwa
H0 benar.
Menurut definisi di atas, dapat dikatakan bahwa dan didapatkan dari memaksimalkan
f(x;) terhadap dan 0. Uji GLR ini digunakan untuk menolak H0 jika ( ) k, dimana k
dipilih untuk melengkapi tingkat kepercayaan .
Contoh 12.8.1
Misalkan Xi N(, 2), dimana 2 diketahui, akan dilakukan uji untuk hipotesis:
H0 : 0
: 0
MLE biasa (tanpa batasan) adalah

, dan GLRnya adalah:


( )
( )

( )
=

(
[

(
(

)
)

]
]

]
= [ ( )
( ) dikatakan menolak H0 jika ( ) k, ekuivalen dengan

Z2

=[

Dimana Z ( ) dan Z2
Z2
( )atau Z

(1), jadi tingkat kepercayaan akan menolak H0 jika:


atau Z

Contoh 12.8.2
Akan dilakukan pengujian hipotesis H0 : 0 dengan
: 0.
Uji GLR pada contoh ini didapatkan dari penurunan uji UMP satu arah yang didasarkan pada
nilai z. Diberikan MLE dengan =[0,)

Karena tingkat kepercayaan pada uji ini cukup kecil untuk menolak H0 dengan nilai yang
besar, ditentukan daerah kritis dari statistik GLR untuk

)
[ (
]
( ) {

Dengan batasan H0, diperoleh P[(X)<1] = P[


]=0,5 atau < 0.5, k < 1, dan daerah
kritisnya tidak akan memuat x sehingga (x)=1.

139

dan (x)

Dengan kata lain, uji GLR menolak H0 jika


Z =[ (

k yang ekuivalen dengan


untuk

z k1 jika dan hanya jika z . Tingkat kepercayaan (untuk


yang juga merupakan uji UMP untuk hipotesis ini.
Uji GLR dari H0 : 0 dan
dengan 0 diberikan oleh

: 0 dengan

;
< 0.5) menolak H0 jika

, pemaksimalan fungsi likelihood

Sehingga

[ (
]
Dapat disimpulkan bahwa keduanya memiliki penyelesaian yang sama untuk pengujian
sederhana terhadap H0 : 0 dan
: 0. Daerah kritis yang sama juga memberikan
tingkat kepercayaan untuk hipotesis null komposit H0 : 0 karena
(
)( ),
( )

P[Z z1- | 0] = , dan P[Z z1- | ] <

untuk <0.

Terkadang diinginkan untuk melakukan pengujian terhadap hipotesis dengan satu parameter
yang tidak diketahui karena adanya parameter bermasalah yang tidak diketahui.
Contoh 12.8.3
Misalkan Xi N(, 2), dimana 2 diketahui, akan dilakukan uji untuk hipotesis H0 : 0
dengan : 0. Hal ini tidak menunjukkan hipotesa null sederhana karena distribusi ini
tidak ditetapkan sepenuhnya dibawah H0. Populasi yang digunakan dua dimensi,
(
) (
) {(
)|
} D] dan H0 : 0
merupakan penyingkatan notasi dari H0 : (,) 0 dimana
) {(
{ } (
)|
}.
Himpunan di atas digambarkan pada gambar di bawah ini:

140

Pemaksimalan f(x; ,) di daerah


0

didapatkan

, MLEnya

dan

dan

, tetapi pada daerah

sehingga,

(
)

( )

(
)

=
=

)
(

(
[

(
[

) ]
) ]

=( )
maka dari itu
(

( )

(
(

)
)
)
(
(

)
)

= 1 +(

(
)

( )
)

dengan ( )

(
(
)

)
(

Dengan batasan H0 : 0, T= ( ) t(n 1) dan T F(1, n 1) menolak H0 saat (x)


bernilai kecil atau dengan nilai T besar dan tingkat kepercayaan akan menolak
jika
t -t1- /2 (n-1) atau t t1- /2 (n-1)
dengan menggunakan uji dua arah berdasarkan pada students t.
Pendekatan GLR juga bisa digunakan untuk dua sampel
Contoh 12.8.4
Misalkan X N(n1, p1) dan Y N(n2,p2) dengan X dan Y independen, akan diuji H0:p1p2=p
dengan : p1p2 , dimana p tidak diketahui.
Populasinya =(0,1)(0,1)={(p1,p2)|0<p1<1 dan 0<p2<1}dan subset koresponding untuk H0
adalah 0={(p1,p2) ={(p1,p2)|0<p1 = p2<1}

Berdasarkan pada x dan y, MLEnya adalah


,

(
) (
) pada daerah 0, statistik GLRnya
(

(
(

) (
) (

)
)

141

pada daerah

dan

) (

) (

) (

) (

Kecuali untuk koefisien binomial, statistik GLR ini tidak akan digunakan pada saat
pengerjaan soal yang sederhana, namun bisa didapatkan dengan perhitungan yang sederhana.
) digunakan untuk p di bawah H0, sehingga tingkat kepercayaan dan daerah
Distribusi (
kritis yang tepat tidak bisa ditentukan. Distribusi chi-square pada kasus ini sangat berguna
untuk ukuran sampel yang besar. Hipotesis H0 menunjukkan pembatasan satu dimensi pada
ruang populasi karena hal itu menunjukkan H0:=p2-p1 = 0 ; jadi r=1 seperti pada contoh
12.8.2 dan pendekatan untuk tingkat kepercayaan :
(
)
( )
(
)
dan H0 ditolak jika
( )
UJI SAMPEL-k
Pendekatan GLR sangat membantu dalam penurunan uji yang melibatkan sampel-sampel
dari dua atau lebih distribusi normal. Sampel acak independen bisa didapatkan dari k
distribusi normal. Untuk setiap j=1,k, akan ditunjukkan arti dari sampel individu j dan
variansi sampel dengan
=

dan

=(

Secara khusus akan diturunkan uji GLR dari H0:


L= L (

=....

=(

(nj-1)
dengan

exp [

exp [

:
)2]
)

Dimana hasilnya mengikuti persamaan log-likelihood :


(

)-

Ln L = - ln (2

Teorema 12.8.1:
Untuk k populasi normal dengan variansi N(
untuk Ho, dimana
=...=
,
ditolak jika:
:
( ) (
)

Dimana

dan

), j = 1,,k, uji tingkat kepercayaan

. Uji ini ekuivalen (memiliki kesamaan) dengan uji

GLR
Teorema 12.8.2:
Misalkan
M=M(

142

]-

Dan diketahui
c = 1+
dimana N =

( ) ; dengan perkiraan

dan

M/c
(
) jika
Untuk nilai kritis vj terkecil didapatkan dari Tabel 31 dan Tabel 32 dari Pearson dan Hartley
(1958).
Untuk sampel normal, (nj 1)sj/ (
) dan jika diketahui wj = sj/ dalam M,
kemudian

akan dibatalkan jika nilainya sama; M(nj 1,sj) mungkin digunakan sebagai uji

statistic untuk menguji H0:


dan distribusi tersebut dapat menunjukkan
pada syarat dari distribusi chi-square yang berada di H0. Statistic ini minimal ketika semua sj
yang diketahui sama dan statistic menjadi maksimal jika sj tidak sama, dengan bantuan Ha
Teorema 12.8.3:
Untuk k populasi normal dengan
uji

), dengan j = 1,,k, kemungkinan nilai dari

akan menolak H0 jika:


(
)

12.9 UJI BERSYARAT


Tingkat kepercayaan
adalah variabel bersyarat, misalnya S suatu parameter yang tidak
diketahui dengan ( | ) tidak bergantung pada
Contoh 12.9.1:
(
) dan
(
) , x dan y saling bebas dengan
Diberikan
, dan
maka pdf bersama x dan y adalah
(
Misalkan S=

sehingga

)(
(
( | )(

)
( )
( )
(
( )

)( )
(

) (

( )(

)
(

)
)

Y= 0,,s dan s= 0,,


Sehingga distribusi berubah menjadi distribusi hypergeometri. Komudian nilai untuk
menolak
jika y
( ) atau untuk tingkat kepercayaan ,menolak

143

jika


Teorema 12.9.1
Diberikan X=(

),
(

( )(

memiliki pdf bersama:


)

) ( )

( )

( )]

( )
( )
Jika
adalah kecukupan bersama
untuk
untuk dan pdf ( | ) ( ) tidak tergantung pada k , sehingga
Ada 2 kemungkinan untuk menolak H0
1. Dengan tingkat kepercayaan untuk menguji
dengan
menolak H0 jika ( )
( ) dimana [(
( )| )]
dengan
2. Dengan tingkat kepercayaan untuk menguji
dengan
menolak H0 jika ( )
( ) dimana [(
( )| )]
dengan
Contoh 12.9.2:
(

maka pdf bersamanya


(

( )

( )

) ( )
[ ( ) (
) ( )]
Dimana h(x) = 1 untuk
dan 0 untuk yang lain
sesuai teorema maka S= ( ) dan T = maka distribusi T tidak bergantung pada k.
Tingkat kepercayaan tidak bergantung atau bersyarat jika [(
( )| )]
maka
[
{ [(
( )]
( )| )]}
( )
12.10. UJI SEKUENSIAL
Sampel ukuran n dapat didekati dengan Neyman-Pearson untuk mengkontruksi Dengan
tingkat kepercayaan
yang besar pada hipotesis sederhana.Seperti pada penghitungan
sampel ukuran n dengan kesalahan tipe II yang biasa dikatakan
Contoh 12.10.1
Gaya (dalam pounds) dapat menyebabkan beberapa tipe bagian keramik mobil menjadi
rusak dengan mean dan standard deviasi =40. Bagian yang asli diketahui memiliki
ketahanan dari rusak dengan tekanan sebesar 100 pounds. Pabrik mengklaim bahwa suku
cadang lebih baik dari pada yang asli karena dapat menahan tekanan hingga 120 pounds.
Untuk mendemonstrasikan klaim tersebut, suatu uji dilakukan dimana ketahanan diukur pada
suatu sample sebanyak n dari suku cadang dengan variabel x1, , xn. berdasarkan pada hasil
data, pabrik suku cadang memilih untuk menggunakan ukuran =0.05 untuk menguji
hipotesis H0 : 100 dan Ha : >100.
Berdasarkan pada teorema 12.7.1 bahwa uji UMP dari nilai untuk H0 : 0 dan
: >0
akan menolak H0 jika
untuk nilai c yang tepat. Selain itu, menurut teorema 12.3.1 yang

144

ekuivalen yakni menolak H0 jika z0= (


)
dan pada contoh ini diketahui
bahwa =P[kesalahan tipe II] maka nilai n diberikan dengan n=(
)/(0-1).
Jadi, untuk memiliki ukuran =0.05 uji terhadap suku cadang dengan =0.10 pada saat
=120, banyaknya sample yang dibutuhkan adalah
n=(1.645+1.282)(40)/(100-120) = 34.
Secara tidak langsung, biaya dari proyek ini bergantung pada banyaknya suku cadang
yang diuji, dimana kemungkinan kepercayaan untuk mencari prosedur yang tepat diperlukan
pengujian pada beberapa bagian suku cadang yang diuji. Kemungkinan tersebut dengan
mempertimbangkan uji sekuensial. Dengan kata lain, ada kemungkinan untuk menemukan
suatu prosedur, seperti menguji beberapa suku cadang awal, yang dapat menghasilkan cukup
bukti untuk menolak ataupun menerima H0 tanpa menggunakan uji lainnya.
UJI RASIO PELUANG SEKUENSIAL (SPRT)
dan
jika
adalah sampel acak berukuran n dari sebuah
) maka sesuai lemma Neyman Pearson adalah
distribusi dengan pdf (
( | )
( | )
( | )
( | )
Sehingga uji rasio peluangnya adalah
(

untuk m= 1,2,

Wilayah kritis yang disimbolkan C dari hasil uji sekuensial adalah gabungan dari himpunan
disjoint sebagai berikut:
)|
(
)
{(
(
)
}
untuk n= 1,2,
Dengan kata lain jika untuk beberapa n, titik (
) ada didalam Cn maka H0 ditolak
untuk sampel ukuran n. Disisi lain, H0 diterima jika titik di atas diterima di suatu daerah,
katakan A, yang merupakan gabungan dari himpunan disjoint An yaitu:
)|
(
)
{(
(
)
}
Menurut uji Neyman Pearson untuk sampel ukuran n ,konstanta k diturunkan sehingga
ukuran dari uji penentuan Hal ini diperlukan untuk mencari konstanta k0 dan k1 sehingga
SPRT akan dapat ditentukan nilai dan untuk peluang berdasarkan kesalahan tipe I dan
tipe II yaitu:
[(

| )]

( )

Dan
[(
Dimana

( )

( )

| )]

( )

) dan notasi integral didefinisikan berikut:

145

Dan
( )

PENDEKATAN UJI SEKUENSIAL


Perkiraan nilai dari k0 dan k1 dapat dihitung dengan menggunakan rumus:

Dimana dan merupakan pendekatan dari k0 dan k1. Berdasarkan pada N< dengan
peluang 1 dan n(
) k0 untuk (
) ada didalam Cn, sehingga
[(

| )]

( )

( )

[(
Dengan /(1-)

| )]

(
)
)k1 untuk (

k0 , karena n(
[(

| )]

Kemudian akan didefinisikan dan


dari penggunaan nilai dan .

) ada didalam An, sehingga


( )

( )

( )

( )

( ) [

EKPETASI UKURAN SAMPEL


[
(
)]
m= 1,2,
( )
( ) [
( )
( )
]

]
( | )

146

( | )

( | )

( )

( | )
(

( )

[(
| )]
( )
yang merupakan nilai kesalahan yang timbul akibat

( )

( )

Contoh 12.10.2
Berdasarkan pada contoh 12.10.1. Diketahui mean dan standard deviasi =40. Akan
dilakukan uji untuk menguji hipotesis null sederhana hipotesis H0 : =100 dan hipotesis
alternatif
: =120 dengan =0.05 dan =0.10.
Sehingga pendekatan nilai kritis untuk SPRT adalah nilai
0.05/(1-0.10)=0.056 dan
= (1-0.05)/0.10=9.5. dengan kata lain, uji tersebut dapat menolak H0 pada n 0.056 dan
menerima H0 pada n 9.5 atau dapat digunakan uji berdasarkan jumlah data dengan pdf
bersama: (

) ], didapatkan:
(

)
(

)
)]
)]
(

) ]

Hasil dari zi dapat digunakan untuk mendapatkan E(Z) dengan


( )

(( )| )

( )

)]
)]

Sehingga untuk penyelesaiannya, didapatkan (( )| )

)(

untuk

dan

berdasarkan pada keterangan diatas dengan 0=100 dan 1=120, maka


[
( |

( |

]
(

)
) [ (

) ]
[

(
) [ ( ) ]
Untuk SPRT, banyaknya sample yang diharapkan secara berurutan adalah 16 dan 19 dengan
syarat H0 dan
, dibandingkan dengan jumlah sample n=34 menurut pertimbangan uji
Neyman-Pearson untuk contoh 12.10.1.

147

RINGKASAN
Pada Bab ini dijelaskan mengenai uji hipotesa dimana ditujukan untuk menguji benar
(
), hipotesa statistik
atau salahnya hipotesa statistik dari suaru percobaan. Jika
adalah pernyataan tentang distribusi . Jika hipotesa tersebut ditetapkan dengan lengkap
(
), maka disebut sebagai hipotesa sederhana, dengan kata lain disebut komposit.
Kesalahan dalam menolak maupun menerima H0 di bedakan menjadi dua, yakni: Kesalahan
tipe I yaitu kesalahan yang terjadi pada saat menolak kebenaran
, sedangkan Kesalahan
tipe II adalah kesalahan yang terjadi pada saat menerima
padahal
salah.
Jika suatu uji ditulis dalam bentuk himpunan data dengan memiliki ukuran sebanyak n
dan daerah kritis (daerah penolakan) merupakan subset dari n-dimensi ruang Euclidean, maka
H0 ditolak pada saat n-dimensi data vector berada di dalam daerah kritis.
Fungsi kuasa memberikan peluang menolak H0 (hipotesa null) yang salah untuk
(hipotesa
alternatif) dengan nilai yang berbeda. Misalkan pada lemma Neyman-Pearson, pada uji ini
terdapatkemungkinan untuk mendapatkan uji kuasa terbesar untuk penentuan ukuran sampel,
namun ada beberapa kasus yang harus menggunakan uji UMP untuk menyelesaikannya.
Uji UMP tak selalu dapat memperoleh hasil, oleh karena itu uji GLR digunakan untuk
mendapatkan hasil yang tepat. Contohnya, pendekatan bisa dilakukan pada beberapa kasus
untuk mendapatkan uji hipotesis dengan parameter yang bermasalah dan juga keadaan
dengan penyelesaian dua-arah. Pada suatu permasalahan, ada kemungkinan untuk
mendapatkan uji UMP unbias (UMPU) yang juga dapat digunakan untuk mendapatkan
parameter yang bermasalah dan juga hipotesa alternatif dengan penyelesaian dua arah.

SOAL-SOAL LATIHAN
1

Andaikan Xo , X1 , ... , X16 sampel acak berukuran n=16 dari distribusi normal XiN(,1).
Akan diuji Ho : = 20 dengan tingkat kepercayaan = 0,05 berdasarkan rata-rata sampel
,
a. Tentukan daerah kritis pada A: {| - < } dan B {| b < }
b. Cari peluang dari kesalahan tipe II, =P[TII], untuk setiap daerah kritis pada soal (a)
untuk
Penyelesaian:
a. Tentukan daerah kritis A: {| - < } dan B {| b < }
P[

=P[

] =P[

)]

Sehingga,
) = 1.65

(
(

= 0.4125

148

= 20 0.4125
= 19.5875
untuk tingkat kepercayaan = 0,05:

= P [b < ] ,

0.05

= P [b < ]

0.05

= P [(

0.05

= P [z

0.05

= P[

0.05

=1P[

0.95

= P [z < 4 (b 20)]

4 (b20)

P[ b]

)]
(

)]

= 1.65

b20

= 0.4125

= 20 + 0.4125
= 20.4125

Jadi didapatkan a=19.5875 dan b= 20.4125


b. Peluang kesalahan tipe II();
Untuk A : { |- < a} ; a:19,5875 untuk Ha : = 21
= P[TI]

=[

>

= P [ z > -5.65 ]
= 1 P [z < -5.65]
=10
=1
Untuk B { | b < } ; b: 20.4125 , Ho : : 21
= P[TI]
=[

<

= P [z < -2.35]
= 0.009

149

2. Sebuah kotak yang berisi empat kelereng, dengan warna putih sebanyak dan warna
hitam sebanyak 4-. Akan diuji
dengan hipotesis alternatif
. Ambil
dua kelereng dengan pengembalian dan menolak H0 jika kedua kelereng yang terambil
berwarna sama.
a) Hitung peluang dari kesalahan tipe 1 (P[TI])
b) Hitung peluang dari kesalahan tipe 2 (P[TII])
Penyelesaian:
a) Dari kotak yang beisi 4 kelereng diambil 2 kelereng dengan pengembalian sehingga
peluang terambilnya kelereng putih pada setiap pengambilan adalah
(

dengan
[

Sehingga

) dimana

dan

( )( ) (

Jadi :
P[TI]

dan
(

|
(

)
|

( )(

)
) (

= 0,8021
(

b) P[TII]
=

( )(

) (

)
)

3. Sebuah sampel acak berukuran 20 dari distribusi normal Xi


s2=16

150

) dan = 11 dan

a. Asumsikan bahwa
= 4, akan diuji H0 :
dengan Ha :
, dengan tingkat
kepercayaan
.
b. Berapa besar = P[TII] jika =105?
c. Berapa banyak sampel yang di butuhkan untuk mendapatkan nilai =10,5?
d. Ujilah hipotesis dari (a) jika
tidak diketahui.
e. Ujilah H0 :
dengan Ha :
dengan tingkat kepercayaan =0,01
f. Berapa sampel yang diperlukan untuk uji pada (e) agar 90% H0 ditolak dengan nilai
=18?
Penyelesaian:
a. Zn =
=

=
= -2,237
Z1-

= 20,99

Z0 < Z1-

= 2,33
sehingga

-2,237<2,33

Z0>-Z1-

Jadi H0 diterima.

b.

= P[TII] , =105
= P[ menolak H0| H0 benar]
0,01= P[ < | ]
0,01= P[

0,01= P[

0,01= P[

]
]

-2,32=
-1,038= c-12
c = 10,96
=P[TII]
= P[menerima H0| H0 salah]
]
=P[
= 1-P[
= 1-P[

]
]

151

= 1-P[

= 1-P[
= 1-0,8485
= 0,1515
c. = 0,9 , =10,5
= 1.
= 0,1
n=

)
(

)
(

)
(

=
= 23,2937 = 24
d. t0 =

= -1,119

-t1-d(n-1) = -t0,99(19)
= -2,359
10> t1-d (n-1)
-1,119>-2,539 , H0 diterima.
e.

V0 =
=

(
(

=
)

= 33,778
(

) , artinya H0 diterima.

f. 1. = 0,9
= 0,1
n =1+2[

]
)

152

= 18,191
V0

)
)

=1+2[

=1+2[

=1+2[

]
= 1+2[
= 1+2[23,9]
= 1+48
= 49

4. Andaikan koin bias yang telah didiskusikan di contoh 9.2.5, dimana probabilitas dari
kepala, p, diketahui 0.20 ,0.30, atau 0.80. Koin dilempar berulang kali dan diberikan X
jumlah lemparan untuk menentukan kepala pertama. Dilakukan pengujian pada
akan menolak
jika
dan tidak menolak yang lain. Tentukan:
a) Berapa probabilitas dari kesalahan tipe I, [ ]?
b) Berapa probabilitas dari kesalahan tipe II, untuk setiap dua nilai lainnya dari p?
}. Tentukan
c) Untuk menguji
, andaikan daerah kritis berbentuk {
[ ] untuk setiap nilai lain dari p.
Penyelesaian
a)

b)

= [
= [
= [
=

]
]

)
(
(

)(

]
= [
=1- [
= 1 0,9932
= 0,0068
= [ ]
= [
= [
|
=

)
)(

153

= [
= 0,999 1
= [ ]
= [
= [
|

c)

|
]
)
(

)(

= [
= 0,999

]
1

7. Sebuah koin dilempar sebanyak 20 kali dan


(kepala yang muncul). Diberikan
(peluang dari munculnya kepala). Sebuah pengujian
dengan
tingkat kepercayaan paling besar
.

dari

a. Lakukan sebuah pengujian menggunakan Teorema 12.4.1.


b. Lakukan sebuah pengujian menggunakan Teorema 12.4.2.
c. Berapa fungsi pangkat dari uji ukuran
dari
untuk alternatif
?
d. Berapa -value untuk pengujian di (b)? Lalu berapa ukuran teramatinya?
Penyelesaian
a.

Sehingga
ditolak
)
b. (
(

Sehingga
c. ( )

ditolak
(

154

(
)(

(
(

d.

-value

) (

)(

(
)

) (

)(

) (

)(

(
)

)(

) (

) (

)(

) (

)(

) (

)
(
)(

8.

) (

)(

) (

)(

) (

)(

(
)

) (

)(

) (

)(

(
)

)(

) (
) (

)
)

Andaikan jumlah cacat dari sebuah kawat panjang adalah t meter yang berdistribusi poisson
X
( ) dan salah satu kecacatan ditemukan pada 100 meter dari sebuah kawat.
a) Uji
dengan
dengan tingkat kepercayaan 0,01, oleh mean dari
teorema 12.5.1
b) Berapa p. valuenya?
c) Andaikan jumlah dari dua cacat yang ditemukan pada kawat adalah 100 meter. Uji
lawan
pada tingkat kepercayaan = 0.0103
d) Cari kuasa dari uji yang ada pada soal c. jika = 0.01
Penyelesaian :
( )
a) s = 1

Uji statistik :

; = 0,01

; t = 100

768
(
b)

nilai p

155

Nilai p = 0,04042768
c) s = 2
; t = 200

; = 0,05

Uji statistik :
(
)

(
(

d)

)
)

9. Andaikan sampel acak independen dari dua distribusi normal,


dan

, dan

) untuk

. Diberikan

) untuk

a. Asumsikan variansinya sama, uji


.
b. Lakukan pendekatan pada tingkat

melawan
untuk menguji

menggunakan persamaan (11.5.13).


c. Lakukan pengujian hipotesa pada tingkat

pada tingkat
melawan

menggunakan persamaan (11.5.17),

asumsukan data teramati dari sampel berpasangan dengan


.
d. Uji

melawan

pada tingkat
.
e. Gunakan Tabel 7 (Lampiran C) untuk menemukan pangkat dari pengujian ini jika

.
Penyelesaian
a.

156

<
(

<

b. Penggunaan persamaan 11.5.3

(
(

)
)

(
))

)
)

<
(

<
c.

Dari 11.5.17
=

157

))

=
(

) =

=
=

( )

( )
Artinya
d.

ditolak

=
=
=
(

) =

)
)

=
=
(

Artinya

diterima

e. Jika
(

Jadi
11. Andaikan sebuah distribusi dengan pdf f(x;) = x-1 untuk 0<x<1 dan 0 untuk yang lain.
a ) Tentukan Most Powerful (MP) bila n = 1 ; H0 :
b ) Hitung power test dari a untuk
Penyelesaian
a)

Menurut lemma Newman-Person :


(

( )

158

( )
( )

; H1 :

dan

Untuk n = 1 didapatkan :
(

( )

[ (

b) [

12.

) berdasarkan nilai teramati dari X.

Penyelesaian:
(
(

( ). Dapatkan uji paling kuat dari

Andaikan
(

)
) =

159

dengan

) =

) =

Menurut Neyman-Pearson Lemma


(

=
Dimana

adalah

Sehingga [

[ (

[ (

| ]

29. Diberikan
(

sampel

, untuk

dengan

acak

dari

sebuah

dengan

PDF

( )

)=

adalah harga
memaksimalkan

( )

yang memaksimumkan ( ) di mana harus dicari


( ) setelah data sampel diurutkan

Sehingga
maksimum terjadi jika paling kecil sehingga
(

( )

( )

( )

Jadi, GLRnya :
( )

distribusi

)
(

( )

| ]

dan 0 untuk yang lain. Dapatkan bentuk uji GLR untuk

pengujian
:
Penyelesaian :
Dicari MLG:
(

]= [

[ (

160

yang

( )

( )
( )

( )

161

BAB XIII
TABEL KONTINGENSI DAN KEBAIKAN SUAI
13.1 PENDAHULUAN
Sebagian besar model yang dibahas pada bab sebelumnya telah ditunjukkan dengan
pdf (
) yang diketahui sebagai bentuk suatu fungsi. Bahkan, sebagian besar metode
statistik telah dibahas dalam bab sebelumnya, seperti estimasi maksimum, yang diturunkan
relatif menjadi model ini. Dalam banyak situasi, tidak mungkin mengidentifikasi dengan
mudah model mana yang akan digunakan, sehingga metode statistik secara umum untuk
menguji kebaikan dan sesuaian model statistik yang relatif dalam bentuk sebuah data, sangat
diperlukan, yaitu dengan menggunakan tabel kontingensi.
13.2 KEJADIAN BINOMIAL UNTUK SATU SAMPEL
Pertama perhatikan jenis percobaan Bernoulli dengan menghasilkan dua
kemungkinan, yaitu A1 dan A2 dengan P(A1) = dan P(A2) = = 1
. Sampel acak dari
percobaan dengan
dan
menunjukkan jumlah hasil jenis tipe dan
masing-masing. Kemudian akan diuji Hipotesis
dengan
dari
(
) situasi ini
jumlah yang diharapkan dengan
dan
digambarkan dalam tabel 13.1.
Sebelumnya telah dibahas pengujian sampel binomial dan juga uji aproksimasi
berdasarkan pendekatan normal terhadap binomial tersebut. Uji aproksimasi juga dapat
dinyatakan dalam bentuk distribusi chi-square dan bentuk ini dapat digeneralisasi untuk
persoalan lebih dari dua jenis kemungkinan hasil dan lebih dari satu sampel.
Distribusi chi-square dari uji statistik didekati oleh distribusi normal yang
didistribusikan sebagai ( ) dan dapat dinyatakan sebagai berikut:
(
)
(
)
(
)
(
)
(
)
(

[(

)
(

)]

Sebuah pendekatan pengujian berukuran

(13.2.1)
adalah menolak

jika

( ).

Statistik
mencerminkan jumlah selisih antara hasil pengamatan dan hasil yang
diharapkan dalam
. Dalam bentuk ini, perbedaan di kedua sel dikuadratkan, tetapi
perbedaannya bergantung linear karena (
)
dan jumlah derajat kebebasan
adalah jumlah sel dikurangi satu.

162

Tabel 13.1
Nilai hasil yang diharapkan dan diamati untuk percobaan Binomial
Kemungkinan Hasil
Total
Probabilitas
1
Hasil Ekspetasi
N
=
=
Hasil Pengamatan
N

Harus diingat bahwa pendekatan chi-square dapat ditingkatkan dalam hal ini dengan
memperkenalkan koreksi untuk diskontinuitas. Dengan demikian, hasil akan lebih akurat
diperoleh dengan menggunakan statistik
(|

(13.2.2)

Uji statistik dengan chi-square umumnya dapat dilakukan dengan dua cara, yaitu
dapat diperpanjang untuk diterapkan ke masalah multinomial dengan jenis hasil dan dapat
digenerasisasi untuk masalah r-sampel binomial, untuk selanjutnya akan dipertimbangkan
masalah r-sampel binomial pertama.

13.3 UJI BINOMIAL UNTUK r- SAMPEL


(
)untuk i= 1,2,.,r, kemudian akan diuji
Misalkan bahwa
dimana
adalah konstanta yang diketahui. Missal
dan
hasil pengamatan dari sampel ke-i, dan misalkan
dan
merupakan hasil yang diharapkan kedalam

,
merupakan
(
)

Dalam hal ini, didapatkan pendekatan chi-square nya adalah,

( )

Sebuah pendekatan pengujian berukuran

13.3.1
adalah menolak

jika

( ).

Contoh 13.3.1
Karakteristik tertentu diyakini terdapat dalam 20% dari populasi. Sampel acak dengan ukuran
50, 100 dan 50 diuji dari masing-masing dari tiga jenis yang berbeda, dengan hasil yang
diamati ditunjukkan dalam tabel 13.2.
Diharapkan jumlah hasil di bawah
kemudian
( )
( )
( )
dan
Sisanya
dapat diperoleh
dengan pengurangan dan ditampilkan dalam Tabel 13.3.

163

Tabel 13.2
Hasil Pengamatan Untuk 3 Sampel Uji Binomial
Hasil Pengamatan
Hadir
Absen
Total
Jenis 1
20
30
50
Jenis 2
25
75
100
Jenis 3
15
35
50
Tabel 13.3
Hasil Ekspetasi Untuk 3 Sampel Uji Binomial
Hasil Pengamatan
Hadir
Absen
Total
Jenis 1
10
40
50
Jenis 2
20
80
100
Jenis 3
10
40
50

didapatkan

= 17.18
Karena

( )

didapat menolak

pada kondisi

Uji kondisi umum p


Masalah-masalah umum adalah apakah pengujian
adalah semua sama,
, dimana nilai umum p tidak spesifik. Diketahui terdapat r x 2 tabel yang
sama dari hasil pengamatan, tetapi nilai p harus diperkirakan untuk memperkirakan nilai
expetasi pada . Pada
MLE dari p adalah estimasi pengelompokan.

Dan

), dimana

Pengujian statistiknya adalah

(13.3.2)

Distribusi limit dari uji statistik ini dapat ditampilkan menjadi chi-square dengan derajat
kebebasan r-1, sehingga sebuah pengujian pendekatan berukuran adalah menolak
jika:

164

(13.3.3)

Pada umumnya dalam kasus ini, satu derajat kebebasan dihilangkan untuk setiap estimasi
parameter yang tidak diketahui. Sebenarnya hal ini sama untuk sampel normal, dimana

( )

Tabel 13.4
Tabel Pengamatan Dari r-sampel Binomial
Sampel
1
2
:
:

Total

:
:

:
:

:
:

r
(

Dalam hal ini terdapat hubungan linear, karena (


)
dan efeknya adalah bahwa
jumlah terakhir setara dengan jumlah
1 kuadrat variabel independen yang normal standar.
Derajat kebebasan juga dapat digambarkan dengan mempertimbangkan tabel
hasil
yang diamati dalam tabel 13.4. Mempunyai nilai tetap dari estimasi berarti mempunyai
semua dari total marjinal dalam tabel tetap. Sehingga nomor
di bagian dalam tabel
dapat diberikan dan semua nomor yang tersisa kemudian akan ditentukan. Secara umum,
jumlah derajat kebebasan yang terkait dengan
tabel dengan total marjinal tetap adalah
(
) (
).
Contoh 13.3.2
Perhatikan kembali data dalam contoh 13.3.1, untuk menguji hipotesis proporsi sederhana
yang mengandung karakteristik yang sama dalam tiga jenis,
Dalam
(
)
(
)
hal ini,

dan jumlah sisanya dari nilai


yang diharapkan dapat diperoleh dengan pengurangan. Nilai-nilai yang diharapkan termasuk
dalam Tabel 13.5.
Dalam hal ini

165

Karena
kondisi

( )

, kita tidak dapat menolak hipotesis proporsi yang umum pada

Tabel 13.5
Hipotesis yang diamati dan
sama.
Hadir
Jenis 1
20(15)
Jenis 2
25(30)
Jenis 3
15(15)
Total
60

diperkirakan di bawah angka nol dalam proporsi yang


Absen
30(35)
75(70)
35(35)
140

Total
50
100
50
200

Perhatikan bahwa mengurangi derajat kebebasan ketika parameter diperkirakan


menghasilkan nilai kritis yang lebih kecil tampaknya wajar, karena memperkirakan dalam
beberapa kesepakatan antara dan
dan lebih kecil dihitung nilai chi-square karena itu
dianggap signifikan. Dalam contoh ini nilai kritis yang lebih kecil masih belum terlampaui,
yang menunjukkan bahwa proporsi semua mungkin sama, meskipun kita telah menolak
hipotesis sederhana sampai 0,2 dalam contoh 13.3.1.
Pada bagian 13.2 disebutkan bahwa koreksi untuk diskontinuitas dapat meningkatkan
akurasi dari pendekatan chi-square untuk ukuran sampel yang kecil. Pendekatan chi-kuadrat
umumnya dianggap cukup akurat untuk tujuan praktis jika semua nilai yang diharapkan
dalam sel masing-masing minimal 2 dan 80% dari 5 atau lebih.

13.4 UJI SATU-SAMPEL UNTUK DISTRIBUSI MULTINOMIAL


Andaikan terdapat
misalkan
,....,
peluang

( )

kemungkinan dari tipe hasil , ,.......,


, dan sampel berukuran ,
merupakan hasil pengamatan dari masing-masing tipe. Diasumsikan
,dimana
,dengan
dan akan diuji hipotesa
=

Uji statistik chi-squared didekati oleh persamaan 13.4.1:

13.4.1

Ada kemungkinan untuk menunjukkan bahwa limit distribusi dari uji statistik dengan
adalah
(
) dan secara konsisten menyatakan bahwa perkiraan jumlah derajat
kebebasan dapat diperoleh dalam kondisi ini. Persamaan (13.2.1) menggambarkan bahwa
satu derajat kebebasan adalah tepat untuk kasus binomial dengan
. Demikian juga
untuk menentukan ukuran sampel,dengan (
) nilai yang diamati.

166

Contoh 13.4.1
Sebuah dadu dilempar 60 kali dan untuk mengujinya, diketahui bahwa
1,,6. Dari H0 hasil yang diharapkan yaitu

=10, maka :

= 6.0 <

, dimana j =

( )

Jadi, dapat disimpulkan bahwa tidak dapat menolak H0 di = 0.10

1
Pengamatan 8
Harapan
10

2
11
10

3
5
10

4
5
6
12 15 9
10 10 10
Tabel 13.6

60
60

13.5 UJI r-SAMPEL UNTUK DISTRIBUSI MULTINOMIAL


Untuk menguji -sampel dari popolasi multinomial yang sama atau populasi
multinomial adalah sama. Misal , ,.......,
merupakan kemungkinan dari tipe hasil,
dan misalkan peluang bahwa hasil dari tipe
yang akan terjadi untuk populasi ke- (atau
sampe ke- ) ditunjukkan dengan
. Perhatikan bahwa
untuk masingmasing

. Misalkan juga bahwa

dalam sampel . Untuk menetapkan

merupakan jumlah hasil pengamatan tipe

( )

, maka

( )

dari

, dan jelas

bahwa persamaan (13.3.1) dapat dinyatakan dalam bentuk ini. Perhitungan untuk masingmasing ,
(

dan

dari

167

( (

))

Permasalahan yang sering terjadi menguji apakah populasi multinomial adalah sama tanpa
menentukan nilai dari
. Sehingga, kita dapatkan

untuk

Harus mengestimasi
parameter
karena
= 1. Dari
MLE dari

sebanyak

, yang juga akan menentukan estimasi dari


akan diestimasi dari perkiraan sampel

, yang menghasilkan persamaan

Dimana

adalah jumlah kolom ke- , dan

Jumlah derajat kebebasan dalam kasus ini adalah (


didapatkan hasil :

) ~

((

)(

))

)(

), dan

13.5.2

Contoh 13.5.1
Pada contoh 13.3.1, diketahui bahwa karakteristik dapat terjadi pada tiga tingkatan yang
berbeda yaitu absen, sedang, atau tinggi. Pada tabel 13.7, harapan untuk menguji

. Hasil pengamatan dapat dilihat pada tabel


13.8. Kemungkinan yang dapat diharapkan di bawah H0 adalah give in
parentheses, dimana =
= ( ) = 50(24/200) = 6, =
=
= 12, =
( ) = 9, =
=
= ( ) = 18, dan
seterusnya.

(
(

)
)

(
(

168

)
)

( )

14.13 > 13.3 =

Jadi, H0 ditolak pada = 0.01


Tinggi

Sedang

Absen

Contoh 1

Contoh 2

Contoh 3

1
1
Tabel 13.7

S1
S2
S3
Total

Tinggi
10(6)
4(12)
10(6)
24

Hasil pengamatan (Hasil Harapan)


Sedang
Absen
10(9)
30(35)
21(18)
75(70)
5(9)
35(35)
36
140
Tabel 13.8

Total
50
100
50
200

13.6 UJI INDEPENDEN , TABEL KONTINGENSI


Andaikan faktor pertama dengan kategori terhubung oleh kolom dan faktor kedua
dengan kategori
terhubung oleh garis di dalam tabel kontingensi
. Misal
menunjukkan peluang yang sampelnya dikelompokkan di dalam kategori baris ke- dan
kategori kolom ke- . Misalkan
=
merupakan peluang marjinal yang secara
individual dikelompokkan di dalam kategori kolom ke- , yang digambarkan pada tabel 13.9.

Kolom
2

Baris 1
Baris 2
Baris 3
1
Tabel 13.9
Perhatikan bahwa jumlah peluang bersama dalam hal ini ditambah 1, sedangkan
dalam tabel 13.7 peluang diperkirakan sesuai dengan peluang bersyarat, dan masing-masing
baris ditambah 1.

169

Dalam pengelompokan individu berdasarkan faktor pertama, tidak terpengaruh oleh


pengelompokan ke kategori lainnya. Sehingga, dikatakan independen jika pengelompokan
peluang bersama adalah hasil dari pengelompokan peluang marjinal,
Untuk uji independen,

. Andaikan

dan

menunjukkan total baris dan kolom sebelumnya, pada kasus tersebut


belum ditentukan.

Misal
menunjukkan jumlah dari hasil, = , = , dan dari
jumlah hasil yang diharapkan untuk gagal dalam kotak (

) diestimasi menjadi :

( )( ) =

Perhatikan bahwa mengurangi nilai yang sama, yang didapatkan dari uji persamaan
proporsi dengan sampel banyak. Sehingga, statistik chi-squared untuk mengukur kesesuaian
antara hasil pengamatan
dan jumlah yang diharapkan dari
, dapat diperoleh.
Demikian juga, hasil perkiraan asimtotik menunjukkan bahwa :

= (

)/

((

)(

))

Dengan memerhatikan jumlah derajat kebebasan, estimasi peluang jumlah dan


)(
).
untuk menentukan total marjinal, adalah (
Contoh 13.6.1.
Survei diambil untuk menentukan apakah ada hubungan antara afiliasi politik dan
kekuatan dukungan untuk eksplorasi. Dipilih secara acak 100 orang untuk diminta afiliasi
politik dan tingkat dukungan untuk mendapatkan data. Ditunjukkan pada tabel 13.10.

(
(

)
)

4.54 < 7.78 =

(
(

)
)

(
)

)
(

( )

Jadi, tidak dapat menolak hipotesis di = 0.10


Afiliasi
Republik
Demokrat

Meningkat
8(9)
10(12)

Dukungan
Sama
12(10.5)
17(14)

170

Menurun
10(10.5)
13(14)

30
40

Independen

12(9)
30

6(10.5)
35
Tabel 13.10

12(10.5)
35

30
100

13. 7 UJI KEBAIKAN SUAI DISTRIBUSI CHI SQUARE


Salah satu contoh kasus distribusi multinomial yang didiskusikan pada bagian 13.4
sesuai untuk melakukan percobaan apakah sampel acak berasal dari distribusi multinomial
yang lengkap. Uji ini dapat disuesuaiakan untuk menguji bahwa sampel acak dberasal dari
distribution khusus yang lengkap,
( ). Hanya membagi ruang sampel ke dalam
bagian c, dikatakan

sehingga didapatkan

Kemudian untuk sampel acak yang berukuran n, diberikan


yang ke j. dibawah

. Sekarang

( ) ditolak jika koefisien

kembali lagi ke dalam bentuk masalah multinomial, dan


kepercayaan jika
(

( ).

menunjukkan jumlah observasi

jumlah yang diharapkan pada bagian j adalah

dimana

Pada beberapa kasus mungkin terdapat pilihan yang alami untuk bagian cell atau data
dikelompokkan untuk memulainya dinyatakan dengan cell buatan yang mungkin dipilih.
Sebagai prinsip umum, banyak cell yang mungkin seharusnya digunakan untuk
meningkatkan nilai dari derajat kebebasan, dengan
atau uji statistic untuk chi square
cukup akurat.
Contoh 13.7.1
Diketahui X menunjukkan waktu perbaikan komponen pesawat terbang. Diuji pada
model Poisson dengan rata rata 3 hari dalam perbaikan komponen pesawat terbang. Pada
percobaan ini terdapat 40 komponen, dengan hasil ditunjukkan pada tabel 13.11. Pada
keadaan yang sama, beberapa komponen bisa diperbaiki dengan tafsiran 0 hari.
( )sehingga diperoleh

( )

dan pada tabel peluang dapat

[
]
( )
( )
,
, dan seterusnya. Nilai dugaan diberikan oleh

ditunjukkan oleh
( )

akhir bagian kanan mencapai


dan
(

,
. Pada tabel

dan dua kolom di bagian awal. Pada kasus ini

( )

171

Sehingga dapat dikatakan bahwa ditolak H0 dengan = 0,10


Tabel 13.11 Pengamatan dan nilai dugaan uji kebaikan suai distribusi chi square untuk
model Poisson dengan rata rata 3
Waktu Perbaikan
0

>7

10

Peluang

0,050

0,149

0,224

0,224

0,168

0,101

0,050

0,034

Nilai dugaan

2,00

5,96

8,96

8,96

6,72

4,04

2,00

1,39

(Hari)
Pengamatan

7,96

7,40

KASUS UNTUK PARAMETER YANG TIDAK DIKETAHUI


Ketika menggunakan prosedur dari kebaikan suai untuk membantu memilih model populasi
yang tepat, biasanya tertarik untuk mencoba apakah beberapa jenis dari distribusi tersebut
dapat diestimasi. Seperti
( ) atau
(
) dimana nilai parameternya
tidak spesifik dari pada mencoba hipotesa seperti
( ) hal ini membuat kekurang
cocokannya karena kesalahan nilai parameter pada. Tetapi apakah model umumnya
mempunyai bentuk perkiraan dan akan menjadi model yang cocok ketika nilai perkiraan
parameternya digunakan
(
) dimana parameter
Andaikan terdapat keinginan untuk menguji
k tidak diketahui, untuk menguji statistik dari
, diharapkan nilainya berada didalam nilai
. Jika data asli dikelompokkan kedalam selnya, kemudian digabung untuk mengamati nilai
dari pdf bersama , , adalah multinomial dimana bernilai benar tetapi tidak diketahui
[

] adalah fungsi dari

jika estimasi maximum likelihood digunakan

untuk mengestimasi
kemudian distribusi limit dari
adalah chi square dengan
derajat kebebasan c-1-k, dimana c adalah nomer dari cell dan k adalah jumlah dari estimasi
parameter. Sehingga didapat

Dimana

nilai yang diharapkan.

Dalam banyak kasus, estimasi MLE didasarkan pada pengelompokan data model multinomial
yang tidak mudah untuk dilaksanakan dan dipraktekkan yang didasarkan pada MLE yang
biasanya pada data yang tidak dikelompokkan

172

Jika MLE yang didasarkan pada orservasi individu yang digunakan, kemudian nilai
dari derajat kebebasan lebih baik dari c-1-k, tetapi distribusi limit dibatasi antara distribusi
chi square dengan c-1 dan c-1-k derajat kebebasan. Kebijakan disini adalah akan
menggunakan c-k-1 sebagai derajat kebebasan jika k merupakan estimasi parameter dari
banyak prosedure ML. pendekatan yang lebih konservatif akan terikat pada P-value pada
pengujian menggunakan c-1-k dan c-1 derajat kebebasan jika MLE tidak didasari langsung
pada pengelompokan data.
Contoh 13.7.2
Perhatikan kembali data yang dibeerikan oleh contoh 13.7.1 dan sekarang dianggap bahwa
harapan pada percobaan
( ). MLE dari adalah rata rata dari 40 kali perbaikan,
dengan
[ ( )

( )

Dan H0 adalah estimasi peluang,

( )

( )]
(

dan nilai dugaaan estimasi

adalah jumlahan menggunakan distribusi Poisson dengan =3,65. Seperti pada 5


kolom yang sama yang digunakan sebelumnya, hasil ini ditunjukkan di tabel 13.12 Tabel
13.12 Pengamatan dan nilai dugaan uji kebaikan suai distribusi chi square untuk model
Poisson dengan rata rata estimasi 3,65
(0,1)

Pengamatan

10

13

Peluang

0,121

0,173

0,211

0,192

0,303

Nilai dugaan

4,84

6,92

8,44

7,68

12,12

Waktu Perbaikan
(Hari)

Didapatkan
(

( )
Jadi sebuah model Poisson dapat memungkinkan untuk data ini, meskipun sebuah model
Poisson dengan =3 ditemukan tidak kebaikkan dengan baik. Dengan nilai derajat kebebasan
disini adalah 3, karena satu parameter telah diestimasi

173

13.8 UJI KEBAIKAN SUAI YANG LAIN


Beberapa kebaikan suai telah dikembangkan dalam hal fungsi distribusi empiris.
prinsip dasarnya adalah untuk melihat seberapa dekat distribusi sampel kumulatif diamati
setuju dengan hipotesis distribusi kumulatif teoritis. beberapa metode untuk mengukur
kedekatan perjanjian telah diusulkan.
Uji EDF umumnya dianggap lebih kuat daripada kebaikan chi-squared uji
kebaikansuai, karena memanfaatkan lebih langsung dari pengamatan individu. tentu saja,
maka tidak berlaku jika data yang tersedia hanya sebagai data dikelompokkan.
Diberikan
menunjukkan sebuah sampel acak memerintahkan ukuran n.
maka EDF atau sampel CDF dinotasikan dengan , Dan pada nilai-nilai memerintahkan
)
dicatat bahwa (
jika kita ingin menguji hipotesis sepenuhnya ditentukan,
( ) maka dibandingkan
dengan pendekatan umum adalah untuk mengukur seberapa dekat perjanjian tersebut adalah
antara ( ) dan ( ) untuk i=1,,n beberapa modifikasi sedikit telah ditemukan
untuklebihmembantu, seperti menggunakan koreksi setengah-point dan membandingkan
hipotesis ( ) nilai-nilai ke (
)
bukan untuk i / n .
karena

( )

). Tes dari setiap H0 sepenuhnya ditetapkan dapat

dinyatakan dipersamakan sebagai tes untuk seragam, dimana


sebagai variabel diperintahkan seragam.

) didistribusikan

UJI CRAMER-VON MISES UNTUK H O


Uji Cramer-Von Mises (CMV)dapat dimodifikasi untuk diterapkan ke sampel tipe II
disensor. jika pengamatan memerintahkan r terkecil dari sampel ukuran n tersedia, maka
uji statistik untuk menguji CMV
( ) diberikan oleh
CM

r
1
(F (
12n i 1

i:n

i 0.5 2
)
n

distribusi CM di bawah H0 adalah sama dengan distribusi


r
1
i 0.5 2
(Ui:n
)
12n i 1
n

dimana

diperintahkan variabel seragam

Contoh 13.8.1
Diberikan 25 sistem kegagalan yang terjadi pada 100 hari periode dan menghitung berapa
kali kegagalan menggunakan distribusi Uniform,
pengamatan sebagai berikut:

174

( )

, dengan 25

5.2

13.6

14.5

14.6

20.5

38.5

42.0

44.5

46.7

48.5

50.3

56.4

62.9

64.

67.1

71.6

79.2

82.6

83.1

85.5

90.8

92.7

95.5

95.6

61.7

Didapatkan

maka dapat dikatakan menolak H0 dengan =0,10 pada level yang

Karena
diinginkan.

Jika sebuah proses Poisson diamati pada waktu t, maka diberikan nilai dugaan, kesuksesan
untuk menghitung berapa kali kegagalan adalah mengkondiikan distribusi dengan variable
diseragamkan.
Jika data dibawah direpresentasikan kesuksesan untuk menghitung berapa kali kegagalan dari
sebuah proses Poisson, maka waktu diantara kegagalan adalah variable dari independent
exponensial. Waktu antara peengamatan satu dengan yang lain:
5.2

8.4

0.9

0.1

5.9

17.9

3.6

2.5

1.2

1.8

1.8

6.1

1.2

1.2

3.0

3.5

7.6

3.4

0.5

2.4

5.3

1.9

2.8

0.1

5.3

Digunakan statistic CM untuk menguji data tersebut secara exponensial. Tunjukkan bahwa
( ). Didapat

(
Karena

, dikatakan tidak dapat menolak H0 pada EXP(5) dengan =0,01.

UJI CRAMER-VON MISES, ESTIMASI PARAMETER


seperti yang disarankan pada bagian sebelumnya kita sering kali lebih tertarik untuk menguji
apakah suatu keluarga tertentu daridistribusi berlaku daripada menguji hipotesis yang
sepenuhnya ditentukan. Untukmenguji
(
) dimana tidak dispesifikan

( (

Dimana menunjukkan MLE dari .


Contoh 13.8.2

175

Sekarang kita melakukan sebuah test dimana waktu perbedaan didalam contoh sebelumnya
dengan distribusi exponensial, EXP(). Pada kasus ini,

dan

Karena (

)
, dikatakan tidak dapat menolak H0 dengan =0,10

KOLOMOGOROV-SMIRNOV OR KUIPER TEST


Kolmogrorov-Smirnov (KS) tesstatistikdidasarkan pada perbedaan maksimum antara sampel
CDF dan hipotesaCDF. untuk menguji H0 : X

D max(i / n F (
i

D max( F (
i

i:n

i:n

F ( x) yang benar-benar ditetapkan, biarkan

))

) (i 1) / n))

D max( D , D )
V D D

carets akan ditambahkan jika parameter yang tidak diketahui harus diestimasi

Contoh 13.8.3.
Perhatikan kembali contoh 13.8.2 menggunakan uji statistic Kolmogorov. Sebuah bagian dari
)
)
EDF (
dan estimasi CDF (
dapat ditunjukkan pada
gambar 13.1. Nilai D dapat ditunjukkan pada order statistic ke lima

176

KESIMPULAN
Tujuan kita di bab ini adalah untuk memperkenalkan beberapa tes yang didesain baik
untuk menentukan apakah distribusi hipotesis memberikan model yang memadai atau untuk
menentukan. apakah variabel acak independen.
Tes chi-kuadrat didasarkan pada ukuran relatif dari perbedaan antara frekuensi yang
diamati dan frekuensi teoritik diprediksi oleh model. mereka memiliki adventages menjadi
cukup sederhana dan juga memiliki pendekatandistribusi chi-kuadrat.

SOAL-SOAL LATIHAN
1. Pada sebuah permainan baseball terdapat 300 pemukul, untuk sesi pertama ada 100
pukulan mendapatkan 20 pukulan. Gunakan persamaan (13.2.1) untuk menguji
terhadap
dengan
sebagai tingkat kepercayaan. Apa yang bisa dilakukan
untuk pengujian satu arah?
Jawab:

Dalam Persamaan 13.2.1

= 3.33+1.3 = 4.63
Menurut Tabel:
( )

( )

( )

Sebuah pendekatan pengujian berukuran

adalah menolak

karena

( ).

2. Koin dilempar 20 kali dan didapatkan 7 kepala. Percobaan ini unbiased dengan
sebagai tingkat kepercayaan. Gunakan persamaan (13.2.1) dan (13.2.2).
Jawab:

Dalam Persamaan (13.2.1)

177

= 1.8
( )

( )

( )

Sebuah pendekatan pengujian berukuran

adalah menerima

( ).

karena

Berdasarkan persamaan (13.2.2)

(|

( )

( )

(|

(|

( )

Sebuah pendekatan pengujian berukuran

adalah menerima

karena

3. Diberikan contoh 13.3.1 yang akan ditunjukkan dengan data sebagai berikut:
Tabel Pengamatan:

Jenis 1
Jenis 2
Jenis 3
(a) Uji
(b) Uji
(c) Uji

Hasil Pengamatan
Hadir
Absen
10
40
50
50
30
20

Total
50
100
50

dengan

dengan
.

dengan

Jawab:
(a)

Tabel Ekspetasi:

Jenis 1

Hasil Pengamatan
Hadir
Absen
12.5
37.5

Total
50

178

( ).

Jenis 2
Jenis 3

50
25

50
25

)
(

100
50

Menurut Tabel:
( )
Sebuah pendekatan pengujian berukuran

adalah menerima

( )

karena

(b)

Tabel Ekspetasi:
Hasil Pengamatan
Hadir
Absen
25
25
50
50
25
25

Jenis 1
Jenis 2
Jenis 3

)
(

Total
50
100
50

)
(

Menurut Tabel:
( )
Sebuah pendekatan pengujian berukuran
(c)

adalah menolak

(
)
(
)
(
)

Tabel Ekspetasi:

179

karena

( )

Hasil Pengamatan
Hadir
Absen
22.5
47.5
45
55
22.5
47.5

Jenis 1
Jenis 2
Jenis 3

)
(

Total
50
100
50

Menurut Tabel:
( )
Sebuah pendekatan pengujian berukuran

adalah menolak

karena

( )

5. Dalam masalah genetic, terjadi perbedaan warna yaitu coklat, putih, dan spot. Peluang
yang terjadi pada warna coklat , warna putih , dan warna spot .
a. Uji hipotesis dengan taraf nyata = 0.1 dengan 40 kali percobaan
Penyelesaian :
( )

Coklat
5
10

Pengamatan
Harapan

( )

( )

Putih
15
10

Spot
20
20

Total
40
40

=5>

( )

( )

Jadi, H0 ditolak
b. Uji hipotesis dengan taraf nyata
adalah 1/9, 4/9,4/9

dengan peluang berturut turut coklat, putih, spot

Penyelesaian :

180

( )

( )

Coklat
5
40/9

Pengamatan
Harapan

=
(

( )

Putih
15
160/9

Spot
20
160/9

Total
40
40

( )

= 0.78 <

( )

Jadi, Ho tidak dapat ditolak atau dengan kata lain Ho diterima

6. Sampel dari 36 kartu dengan pengembalian dari tumpukan 52 kartu dengan komposisi
sebagai berikut :
Spades
6

Hearts
8

Diamonds
9

Clubs
13

Uji hipotesis dengan taraf nyata = 0.05


Penyelesaian :
( )

( )

( )

( )
Spades
6
54/13

Pengamatan
Harapan

=
(

Hearts
8
72/13

Diamonds
9
81/13

( )

= 4.9 <

Jadi, Ho tidak dapat ditolak atau dengan kata lain Ho diterima

181

( )

Clubs
13
9

11. Sampel dari 400 orang yang setuju mendukung keseimbangan anggaran belanja dan
mereka yang setuju mendukung pengetahuan umum dapat dilihat dalam tabel berikut :
Pendukung keseimbangan anggaran belanja
Strong
Undecided
Weak
100
80
20
60
50
15
20
50
5

Pengetahuan umum
Strong
Undecided
Weak

Uji hipotesis dari independen dengan taraf nyata = 0.05


Penyelesaian :

,
)

= 17.89 >

,
(
(

)
)

Pendukung keseimbangan anggaran belanja


Strong
Undecided
Weak

Total

100(90)
60(56.25)
20(33.75)
180

200
125
75
400

=
)

Pengetahuan
umum
Strong
Undecided
Weak

80(90)
50(56.25)
50(33.75)
180

20(20)
15(12.5)
5(7.5)
40

( )

( )

Jadi, Ho ditolak
8. Sebuah balok terdapat 5 kelereng hitam dan 10 kelereng putih. Pemain A dan Pemain B
mengambil 3 kelereng dari balok dan mencatat berapa kali kelereng hitam terambil. Pemain
A dan Pemain B mempunyai 100 kali kesempatan pengambilan dengan hasil sebagai berikut:
0
1
2
3
Pemain A
25
40
25
10

182

Pemain B
40
40
15
5
Gunakan persamaan 13.5.2 untuk menguji hipotesis bahwa 2 populasi multinomial adalah
sama dengan
Penyelesaian:
Persamaan 13.5.2

((

)(

))

Dengan

, dan seterusnya

Sehingga didapat tabel


Pemain A
Pemain B
(

0
25 (32,5)
40 (32,5)
65
)

1
40 (40)
40 (40)
80
(
)

2
25 (20)
15 (20)
40

3
10 (7,5)
5 (7,5)
15

100
100
200

Sedangkan
((
Karena

)(

))

((

)(

))

( )

( ). Jadi dikatakan menolak (tidak menerima) H0

9. Sebuah survey telah disebarkan sebagai distribusi pada penyewaan peternakan dalam
suatu periode waktu di Audobon County, Iowa, dengan persamaan 3 perbedaan level
kesuburan tanah. Dibawah ini adalah hasil survey yang dikutib dari Snedecor (1956,
halaman 225):
Soil
Owned
Rented
Mixed
I
36
67
49
152
II
31
60
49
140
III
58
87
80
225
Uji Hipotesis daari populasi multinomial untuk 3 perbedaan level kesuburan tanah dengan
Penyelesaian :
Pada soal ini, digunakan subbab 13.6
Dengan

Sehingga didapat tabel:


Soil
Owned
I
36 (36,7)

, dan seterusnya
Rented
67 (62,9)

183

Mixed
49 (52,3)

152

II
III

31 (33,8)
58 (54,4)
125

60 (57,9)
87 (93,1)
214

((

49 (48,2)
80 (77,5)
178

)(

140
225

))

Sedangkan
((

)(

))

)(

((

))

( )

( ). Jadi dikatakan tidak dapat menolak (menerima) H0


Karena
10. Sebuah kerusakan komponen pesawat terbang dapat dibedakan menjadi 3 jenis, yaitu
mesin, aliran listrik, dan lainnya. Dua desaign pesawat terbang telah diciptakan dan terdapat
keinginan untuk menguji hipotesis kerusakan komponen pada desaign pesawat terbang. Uji
hipotesis dengan
pada data dibawah ini:
Mesin
Aliran Listrik
Lainnya
Desaign 1
50
30
60
140
Desaign 2
40
30
40
110
Penyelesaian:
Pada soal ini, digunakan subbab 13.6
Dengan

Sehingga didapat tabel


Mesin
Desaign 1
50 (50,4)
Desaign 2
40 (39,6)
90

, dan seterusnya

Aliran Listrik
30 (33,6)
30 (26,4)
60

Lainnya
60 (56)
40 (44)
100
)

((

140
110
250
)(

))

Sedangkan
((
Karena

)(

))

((

)(

))

( )

( ). Jadi dikatakan tidak dapat menolak (menerima) H0

184

DAFTAR PUSTAKA
Bain, Lee J, 1992, Introduction to Probability and Mathematical Statistics Second Edition,
Duxbury Press, California.

185