Anda di halaman 1dari 8

Teori dan Metode Statistik

Abstrak
Dimulai dengan Neyman-Pearson Lemma dasar untuk menguji hipotesis
sederhana terhadap alternatif sederhana, tes yang paling kuat secara
seragam untuk masalah satu sisi dalam keluarga Rasio Kemungkinan
Monoton dibangun. Untuk menangani masalah dua sisi dan untuk menguji
satu parameter dengan adanya parameter gangguan , konsep Tes Tidak Bias
diperkenalkan dan Tes Tidak Bias Paling Kuat Secara Seragam dibangun,
sebagian besar dalam konteks keluarga eksponensial . Untuk situasi yang
lebih umum, Tes Terbaik Lokal dibangun. Diperlukan Generalized Neyman-
Pearson Lemma untuk mengatasi semua masalah ini. Topik lain yang dibahas
dalam bab ini adalah nilai- p , Tes Rasio Probabilitas Berurutan, dan interval
kepercayaan.

Kata kunci ; Tingkat Signifikansi dan Kekuatan ,Keluarga MLR, Tes Tidak Bias, Wilayah
serupa, SPRT Interval Keyakinan p -nilai

Abstract
Starting with the basic Neyman-Pearson Lemma for testing a simple hypothesis
against a simple alternative, uniformly most powerful tests for one-sided problems in
Monotone Likelihood Ratio families are constructed. To deal with two-sided problems
and to test for one parameter in the presence of nuisance parameters, the concept of
Unbiased Tests is introduced and Uniformly Most Powerful Unbiased Tests are
constructed, mostly in the context of exponential families. For more general
situations, Locally Best Tests are constructed. A Generalized Neyman-Pearson
Lemma is needed to deal with all these problems. Other topics discussed in this
chapter are p-values, Sequential Probability Ratio Tests, and confidence intervals.
Keywords :Level of Significance and Power, MLR Family, Unbiased Test, Similar Region,
SPRT Confidence Interval p-value
BAB I

PENDAHULUAN

Tes yang paling kuat secara seragam (UMPTs) diusulkan oleh Neyman dan Pearson
dalam serangkaian artikel yang diterbitkan hampir seabad yang lalu [misalnya, Neyman dan
Pearson (1928, 1933); melihatLehmann dan Romano ( 2005) untuk tinjauan komprehensif
literatur berikutnya]. Mereka didefinisikan sebagai tes hipotesis statistik yang memberikan
kekuatan terbesar di antara semua tes dengan ukuran tertentu. Tujuan artikel ini adalah untuk
memperluas gagasan klasik UMPTs ke paradigma Bayesian melalui definisi tes Bayesian paling
kuat secara seragam (UMPBTs) sebagai tes yang memaksimalkan kemungkinan bahwa faktor
Bayes terhadap hipotesis nol tetap melebihi ambang batas yang ditentukan. Ekstensi ini penting
dari beberapa perspektif. Dari perspektif klasik, hasil uji hipotesis adalah keputusan untuk
menolak hipotesis nol atau tidak menolak hipotesis nol. Pendekatan pengujian hipotesis ini
terkait erat dengan teori rasionalisme kritis Popper, di mana teori-teori ilmiah tidak pernah
diterima sebagai kebenaran, melainkan hanya mengalami pengujian yang semakin berat
[misalnya,Mayo dan Spanos (2006), popper (1959)]. Banyak ilmuwan dan filsuf, terutama
Bayesian, menemukan pendekatan ini tidak memuaskan untuk setidaknya dua alasan
[misalnya,Howson dan Urbach (2005), Jeffreys (1939)].

1. Hipotesis Satu Sisi Terhadap Alternatif Satu Sisi pada Keluarga Monoton Likelihood
Ratio
Kami memulai bagian ini dengan definisi tes UMP.
Definisi
Sebuah tes φ adalah tes UMP pada tingkat α untuk H  0 : q ∈ q  0 vs H  1 : q ∈ q  1 jika
(Saya) supθ∈Θ0Eθ[φ(x)]≤α, dan

(ii) E θ [ φ ( X )] ≥E θ [ ψ ( X )] untuk semua θ ∈ q  1 , setiap kali ψ memenuhi (i).

Meskipun persyaratan (ii) sangat ketat, tes UMP memang ada dalam jenis situasi tertentu. Pada
bagian sebelumnya kita telah melihat bahwa untuk Poisson ( θ ), tes MP di
tingkat α untuk H  0 : θ = θ  0 vsH1:θ=θ1>θ0memiliki sifat kuat menjadi tingkat UMP α tes
untuk komposit hipotesis H  0 : θ ≤ θ  0 vs alternatif komposit H  1 : θ > θ  0 . Ini sebenarnya
berlaku dalam konteks yang jauh lebih luas.

Definisi
Mari { P  θ , θ ∈ q } menjadi keluarga probabilitas pada (x,SEBUAH)dan biarkan p  q menyatakan
pdf atau PMF sesuai dengan P  θ manaΘ=Ratau Θ adalah dalam intervalR. Seperti keluarga
{ p  θ } dikatakan rasio monoton kemungkinan (MLR) keluarga jika terdapat bernilai real
statistik T ( x ) sehingga untuk setiap θ  1 < θ  2 di Θ ,Pθ2(x)/Pθ1(x)adalah fungsi tak
menurun dari T ( x ). [JikaPθ1(x)=0<Pθ2(x), mendefinisikan Pθ2(x)/Pθ1(x)=+∞.]
Soal
Membiarkan Pθ(x)=C(θ)exp[Q(θ)T(x)]H(x)di mana Q ( θ ) adalah fungsi
nondecreasing. Kemudian { p  θ } adalah keluarga MLR. Ini termasuk
(sebuah) Pθ(x)=(2πσ2)-n/2exp-12σ2Σ1nxSaya-θ2, xSaya∈R, θ∈R, Σ  2 tetap.

(B) Pθ(x)=(2πθ)-n/2exp-12θΣ1nxSaya-μ2, xSaya∈R, θ∈R+, Μ tetap.

(C)Pθ(x)=e-nθθΣ1nxSaya/Π1nxSaya!, xSaya∈0,1,2,…, θ∈R+.

(D)Pθ(x)=θΣ1nxSaya(1-θ)n-Σ1nxSaya, xSaya∈0,1, Q ∈ (0,  1).

Metode Bayesian Subyektif telah lama memberi para ilmuwan mekanisme formal untuk
menilai probabilitas bahwa teori standar itu benar. Sayangnya, prosedur pengujian Bayesian
subjektif belum—dan kemungkinan besar tidak akan pernah diterima secara umum oleh
komunitas ilmiah. Dalam sebagian besar masalah pengujian, kisaran pendapat ilmiah mengenai
besarnya pelanggaran dari teori standar terlalu besar untuk membuat laporan satu faktor Bayes
subjektif bermanfaat. Selanjutnya, jurnal ilmiah telah menunjukkan keengganan untuk
mengganti laporan satuP-nilai dengan kisaran faktor Bayes yang ditentukan secara subjektif atau
probabilitas model posterior. Mengingat kenyataan ini, Bayesian subjektif mungkin menganggap
UMPBT berguna untuk mengkomunikasikan hasil tes Bayesian ke nonBayesian, bahkan ketika
UMPBT hanya salah satu dari beberapa tes Bayesian yang dilaporkan.

Dengan mengurangi kontroversi mengenai spesifikasi densitas sebelumnya pada nilai


parameter di bawah hipotesis individu, UMPBT juga dapat digunakan untuk memusatkan
perhatian pada spesifikasi probabilitas sebelumnya pada hipotesis itu sendiri. Dalam contoh uji
klinis yang dijelaskan di atas, misalnya, nilai probabilitas keberhasilan yang ditentukan di bawah
hipotesis alternatif mungkin kurang penting dalam pemodelan probabilitas model posterior
daripada memasukkan informasi mengenai hasil uji coba sebelumnya pada suplemen terkait.
UMPBT memiliki sifat menguntungkan tertentu yang tidak dimiliki oleh metode Bayesian
objektif lainnya. Misalnya, sebagian besar tes Bayesian objektif secara implisit mendefinisikan
kepadatan alternatif lokal sebelumnya pada parameter model di bawah hipotesis alternatif
[misalnya,Berger dan Pericchi (1996), Jeffreys (1939), O'Hagan (1995)].

Seperti yang ditunjukkan dalamJohnson dan Rossell (2010), namun, penggunaan prior
alternatif lokal mempersulit pengumpulan bukti yang mendukung hipotesis nol yang benar. Ini
berarti bahwa banyak metode Bayesian objektif hanya sedikit lebih baik daripada uji signifikansi
klasik dalam meringkas bukti yang mendukung hipotesis nol. Untuk ukuran sampel kecil hingga
sedang, UMPBT menghasilkan hipotesis alternatif yang sesuai dengan kepadatan alternatif
alternatif nonlokal, yang berarti bahwa mereka mampu untuk memberikan ringkasan yang lebih
seimbang dari bukti yang dikumpulkan untuk mendukung hipotesis alternatif yang benar dan nol.
UMPBT juga memiliki sifat-sifat tertentu yang tidak menguntungkan.
Seperti banyak metode Bayesian objektif, UMPBT dapat melanggar prinsip kemungkinan, dan
perilakunya dalam pengaturan sampel besar dapat menyebabkan inkonsistensi jika ambang batas bukti
dipertahankan konstan. Dan hipotesis alternatif yang dihasilkan oleh UMPBT tidak kabur atau
noninformatif. Komentar dan diskusi lebih lanjut mengenai masalah ini disediakan di bawah ini. Untuk
mendefinisikan UMPBT, ada baiknya untuk terlebih dahulu meninjau sifat dasar uji hipotesis Bayesian.
Berbeda dengan uji hipotesis statistik klasik, uji hipotesis Bayesian didasarkan pada perbandingan
probabilitas posterior yang ditetapkan untuk hipotesis yang bersaing. Dalam tes parametrik, hipotesis
yang bersaing dicirikan oleh kepadatan sebelumnya yang mereka terapkan pada parameter yang
menentukan kepadatan pengambilan sampel yang dimiliki oleh kedua hipotesis. Tes tersebut terdiri dari
fokus artikel ini. Secara khusus, diasumsikan bahwa kemungkinan posterior antara dua hipotesisH1 dan
H0 dapat dinyatakan sebagai

¿ M ( x) P( H 1)
2 ) P H 1 Ix ¿ ¿= 1 x
P H0 I x ¿ M o ( x) P(H O )

dimana BF10(x) = M1(x)/M0(x) adalah faktor Bayes antara hipotesis H1 dan H0,

∫ (3) MSaya (x) = F (x | θ)πSaya (θ | HSaya ) Dθ –

adalah kepadatan marjinal data di bawah hipotesis HSaya , F (x | θ) adalah kerapatan


pengambilan sampel data x diberikan θ , πSaya (θ | HSaya ) adalah densitas sebelumnya pada θ dibawah
HSaya dan p(HSaya )adalah probabilitas sebelumnya yang ditetapkan untuk hipotesis HSaya , untuk Saya
= 0, 1. Kerapatan awal marjinal untuk θ demikian

(θ) = π0(θ | H0)P (H0) + π1(θ | H1)p(H1).

Ketika tidak ada kemungkinan kebingungan, πSaya (θ | HSaya ) akan dilambangkan lebih
sederhana dengan πSaya (θ). Ruang parameter dilambangkan dengan- dan ruang sampel dengan x .
Logaritma dari faktor Bayes disebut bobot bukti. Semua kepadatan diasumsikan didefinisikan
sehubungan dengan ukuran dasar yang sesuai (misalnya, Lebesgue atau ukuran penghitungan).

Akhirnya, asumsikan bahwa satu hipotesis—hipotesis nol H0—ditetapkan berdasarkan


pertimbangan ilmiah, dan bahwa kesulitan dalam membangun uji hipotesis Bayesian muncul dari
persyaratan untuk menentukan hipotesis alternatif. Asumsi ini mencerminkan situasi yang dihadapi
dalam pengujian hipotesis klasik di mana hipotesis nol diketahui, tetapi tidak ada hipotesis alternatif
yang didefinisikan. Dalam contoh uji klinis, misalnya, hipotesis nol sesuai dengan asumsi bahwa
probabilitas keberhasilan pengobatan baru sama dengan pengobatan standar, tetapi tidak ada nilai yang
jelas (atau kepadatan probabilitas sebelumnya) yang seharusnya ditugaskan untuk probabilitas
keberhasilan pengobatan di bawah hipotesis alternatif bahwa itu lebih baik daripada standar perawatan.
Dengan asumsi dan definisi ini, ada baiknya untuk meninjau properti faktor Bayes yang berkaitan ketika
kepadatan sebelumnya yang mendefinisikan hipotesis alternatif salah ditentukan. MembiarkanπT (θ |
H1) = πT (θ) menunjukkan kepadatan sebelumnya "benar" pada θ di bawah asumsi bahwa hipotesis
alternatif itu benar, dan mariMT (x) menunjukkan kepadatan marjinal yang dihasilkan dari data. Secara
umumπT (θ) tidak diketahui, tetapi masih mungkin untuk membandingkan sifat-sifat bobot bukti yang
akan diperoleh dengan menggunakan kerapatan sebelumnya yang sebenarnya di bawah hipotesis
alternatif dengan yang akan diperoleh dengan menggunakan kerapatan sebelumnya lainnya. Dari
perspektif frequentist,πT mungkin mewakili massa titik yang terkonsentrasi pada parameter penghasil
data yang sebenarnya, tetapi tidak diketahui. Dari perspektif Bayesian,πT mungkin mewakili ringkasan
pengetahuan yang ada tentang θ sebelum suatu percobaan dilakukan. KarenaπT tidak tersedia, misalkan
π1(θ | H1) = π1(θ) malah digunakan untuk mewakili kepadatan sebelumnya, sekali lagi di bawah asumsi
bahwa hipotesis alternatif benar. Maka dari pertidaksamaan Gibbs diperoleh bahwa

yang berarti bahwa bobot bukti yang diharapkan yang mendukung hipotesis alternatif selalu
berkurang ketika π1(θ) berbeda dari πT (θ) (pada himpunan dengan ukuran lebih besar dari 0). Secara
umum, UMPBT yang dijelaskan di bawah ini akan menurunkan bobot rata-rata bukti yang diperoleh
untuk mendukung hipotesis alternatif yang benar.Dengan kata lain, bobot bukti yang dilaporkan dari
UMPBT akan cenderung meremehkan bobot bukti aktual yang diberikan oleh eksperimen yang
mendukung hipotesis alternatif yang benar.

Seperti uji hipotesis statistik klasik, konsekuensi nyata dari uji hipotesis Bayesian sering kali
adalah penolakan terhadap satu hipotesis, katakanlah H0, mendukung yang kedua, katakan H1. Dalam
uji Bayesian, hipotesis nol ditolak jika probabilitas posterior dariH1 melebihi ambang batas tertentu.
Mengingat peluang sebelumnya antara hipotesis, ini setara dengan menentukan ambang batas,
katakanlahγ , di mana faktor Bayes antara H1 dan H0 harus jatuh untuk menolak H0 untuk kepentingan
H1. Oleh karena itu beberapa kepentingan praktis untuk menentukan hipotesis alternatif yang
memaksimalkan probabilitas bahwa faktor Bayes dari tes melebihi ambang batas yang ditentukan.

Dengan motivasi dan notasi ini, sebuah UMPBT(γ ) secara formal dapat didefinisikan sebagai berikut.
DEFINISI. Tes Bayesian yang paling kuat secara seragam untuk ambang batas bukti> 0 mendukung
hipotesis alternatif H1 melawan hipotesis nol tetap H0, dilambangkan dengan UMPBT(γ ), adalah uji
hipotesis Bayesian di mana faktor Bayes untuk pengujian memenuhi pertidaksamaan berikut untuk
setiap: θ T ∈ - dan untuk semua hipotesis alternatif

H2 : θ ~ π2(θ): [ ] [ ] (5) Pθ T BF10(x) > ≥ Pθ T BF20(x) >

Dengan kata lain, UMPBT (γ ) adalah tes Bayesian yang hipotesis alternatifnya ditentukan sehingga
memaksimalkan probabilitas bahwa faktor Bayes BF10(x) melebihi ambang batas bukti γ untuk semua
nilai yang mungkin dari parameter penghasil data θ T . Sisa dari artikel ini disusun sebagai berikut. Pada
bagian selanjutnya, UMPBT dijelaskan untuk model keluarga eksponensial satu parameter. Seperti
dalam kasus UMPT, resep umum untuk membangun UMPBT hanya tersedia dalam kelas kepadatan ini.
Teknik khusus untuk mendefinisikan UMPBT atau perkiraan UMPBT di luar kelas ini dijelaskan nanti di
Bagian 4 dan 5.

2. Model keluarga eksponensial satu parameter

Asumsikan bahwa {x1, . . . , xn} x adalah iid dengan kepadatan sampling (atau fungsi massa probabilitas
dalam kasus data diskrit) dari bentuk

(6) f (x | ) = h(x) exp (θ)T (x) - A(θ)

di mana T (x), h(x), (θ) dan A(θ) adalah fungsi yang diketahui, dan (θ) bersifat monoton. Pertimbangkan
uji satu sisi dari hipotesis nol titikH0 : θ = θ0 terhadap hipotesis alternatif yang sewenang-wenang.
Membiarkanγ menunjukkan ambang batas bukti untuk UMPBT(), dan asumsikan bahwa nilai θ0 telah
diperbaiki. Lemma

1. Asumsikan kondisi paragraf sebelumnya berkaitan, dan tentukan Gγ (θ,0) berdasarkan

Selain itu, mendefinisikan kamu menjadi 1 atau -1 menurut apakah (θ) naik atau turun secara monoton,
masing-masing, dan tentukan v menjadi baik 1 atau -1 menurut apakah hipotesis alternatif
membutuhkan lebih besar dari atau kurang dari0, masing-masing. Kemudian UMPBT(γ ) dapat diperoleh
dengan membatasi dukungan dari1(θ)ke nilai yang termasuk dalam himpunan.

PATAP. Pertimbangkan kasus di mana hipotesis alternatif membutuhkanθ menjadi lebih besar dari θ0
dan (θ) meningkat (sehingga uv = 1), dan biarkan θT menunjukkan parameter yang benar (yaitu,
menghasilkan data) untuk x di bawah (6). Pertimbangkan alternatif sederhana pertama yang
sebelumnya padaθ adalah massa titik di θ1. Kemudian

Oleh karena itu peluang dalam (9) mencapai nilai maksimumnya ketika ruas kanan pertidaksamaan
diperkecil, tanpa memperhatikan distribusi.
HASIL DAN PEMBAHASAN

1. Bagian (i) dan (ii) 


Pertama pertimbangkan kasus sederhana vs sederhana denganH0*:θ=θ0 vs H1*:θ=θ1di
mana θ  1 > θ  0 adalah tetap. Kemudian oleh NP Lema, MP tingkat α tes
untukH0* vs H1*menolak H  0 untuk nilai yang besarPθ1(x)/Pθ0(x)(yaitu, untuk nilai
besar T ( x )) oleh properti MLR. Selain itu, dengan adanya bagian dari NP Lema, terdapat c dan
0 ≤ gamma ≤ 1 sehingga tes
φ(x)=Saya(C,∞)[T(x)]+γSaya{C}[T(x)]memuaskanEθ0[φ(x)]=α.
Karena bentuk:
φ(x)=0,T(x)<C1,T(x)>Cdanφ(x)=0,Pθkankan(x)<kPθkan(x)1,Pθkankan(x)>kPθkan(x)
setara untuk semua θkan<θkankan, tes ini UMP di level αkan=βθkan untuk
pengujian H0**:θ=θkan vs H1**:θ=θkankan kapan pun θkan<θkankan(oleh bagian kecukupan
NP Lemma). Selanjutnya, perhatikan bahwa sebagai akibat wajar dari NP
Lemma,β(θkankan)>αkan=βθkan jika αkan<1, Yang membuktikan bahwa β ( θ ) adalah sangat
meningkat, sehingga selama itu adalah <1. Hal ini membuktikan bagian (ii).
Sekarang catatan bahwa untuk tes ini, β ( θ ) = E θ [ φ ( X )] ≤ α untuk semua θ ≤ θ  0 , yang
membuat φ tingkat α tes untuk H  0 : θ ≤ θ  0 . Membiarkan
Ψα=semua tesψseperti yangsupθ≤θ0Eθ[ψ(x)]≤αdanΨα*=semua tesψseperti yangEθ0[ψ(x)]≤α.
Kemudian Ψα⊂Ψα*. Kami telah menunjukkan bahwa
φ∈ΨαdanEθ1[φ(x)]≥Eθ1[ψ(x)]untuk semuaψ∈Ψα*.
Karenanya Eθ1[φ(x)]≥Eθ1[ψ(x)]untuk semua ψ ∈ Ψ  a .
Merek ini φ tes MP di tingkat α untuk H  0 : θ ≤ θ  0 vs H  1 : θ > θ  0 . Akhirnya, karena φ tidak
bergantung pada θ  1 > θ  0 , itu adalah UMP pada tingkat α untuk H  0 : θ ≤ θ  0 vs H  1 : θ > θ  0 .
Bukti bagian (iii) adalah analog, dan bagian (iv) dibuktikan dengan mengamati bahwa daya
diminimalkan jika semua ketidaksetaraan dibalik dalam NP Lemma.
REFERENSI

BERGER, J. (2006). Kasus untuk analisis Bayesian objektif.anal bayesian. 1 385–402.


MR2221271

BERGER, JO dan PERICCHI, LR (1996). Faktor intrinsik Bayes untuk pemilihan model dan
ramalan. J. Amer. Statistik. asosiasi. 91 109-122. MR1394065

BERGER, JO dan SELLKE, T. (1987). Menguji hipotesis nol titik: KetidakcocokanP nilai-nilai
dan bukti. J. Amer. Statistik. asosiasi. 82 112-122.

BERGER, JO dan WOLPERT, RL (1984). Prinsip Kemungkinan. Institut Matematika Catatan


Kuliah Statistik—Seri Monografi

6. IMS, Hayward, CA.MR0773665 Ekurcaci, W., LINDMAN, Tanganrata-rata, L. (1963).


Inferensi statistik Bayesian untuk psikopenelitian logis. Tinjauan Psikologis 70 193–242.
HOWSON, C. dan URBACH, P. (2005).

Penalaran Ilmiah: Pendekatan Bayesian, edisi ke-3. Membuka Pengadilan, Chicago, IL.
JEFFREYS, H. (1939). Teori Probabilitas. Universitas Cambridge Pers, Cambridge

Anda mungkin juga menyukai