Abstrak
Dimulai dengan Neyman-Pearson Lemma dasar untuk menguji hipotesis
sederhana terhadap alternatif sederhana, tes yang paling kuat secara
seragam untuk masalah satu sisi dalam keluarga Rasio Kemungkinan
Monoton dibangun. Untuk menangani masalah dua sisi dan untuk menguji
satu parameter dengan adanya parameter gangguan , konsep Tes Tidak Bias
diperkenalkan dan Tes Tidak Bias Paling Kuat Secara Seragam dibangun,
sebagian besar dalam konteks keluarga eksponensial . Untuk situasi yang
lebih umum, Tes Terbaik Lokal dibangun. Diperlukan Generalized Neyman-
Pearson Lemma untuk mengatasi semua masalah ini. Topik lain yang dibahas
dalam bab ini adalah nilai- p , Tes Rasio Probabilitas Berurutan, dan interval
kepercayaan.
Kata kunci ; Tingkat Signifikansi dan Kekuatan ,Keluarga MLR, Tes Tidak Bias, Wilayah
serupa, SPRT Interval Keyakinan p -nilai
Abstract
Starting with the basic Neyman-Pearson Lemma for testing a simple hypothesis
against a simple alternative, uniformly most powerful tests for one-sided problems in
Monotone Likelihood Ratio families are constructed. To deal with two-sided problems
and to test for one parameter in the presence of nuisance parameters, the concept of
Unbiased Tests is introduced and Uniformly Most Powerful Unbiased Tests are
constructed, mostly in the context of exponential families. For more general
situations, Locally Best Tests are constructed. A Generalized Neyman-Pearson
Lemma is needed to deal with all these problems. Other topics discussed in this
chapter are p-values, Sequential Probability Ratio Tests, and confidence intervals.
Keywords :Level of Significance and Power, MLR Family, Unbiased Test, Similar Region,
SPRT Confidence Interval p-value
BAB I
PENDAHULUAN
Tes yang paling kuat secara seragam (UMPTs) diusulkan oleh Neyman dan Pearson
dalam serangkaian artikel yang diterbitkan hampir seabad yang lalu [misalnya, Neyman dan
Pearson (1928, 1933); melihatLehmann dan Romano ( 2005) untuk tinjauan komprehensif
literatur berikutnya]. Mereka didefinisikan sebagai tes hipotesis statistik yang memberikan
kekuatan terbesar di antara semua tes dengan ukuran tertentu. Tujuan artikel ini adalah untuk
memperluas gagasan klasik UMPTs ke paradigma Bayesian melalui definisi tes Bayesian paling
kuat secara seragam (UMPBTs) sebagai tes yang memaksimalkan kemungkinan bahwa faktor
Bayes terhadap hipotesis nol tetap melebihi ambang batas yang ditentukan. Ekstensi ini penting
dari beberapa perspektif. Dari perspektif klasik, hasil uji hipotesis adalah keputusan untuk
menolak hipotesis nol atau tidak menolak hipotesis nol. Pendekatan pengujian hipotesis ini
terkait erat dengan teori rasionalisme kritis Popper, di mana teori-teori ilmiah tidak pernah
diterima sebagai kebenaran, melainkan hanya mengalami pengujian yang semakin berat
[misalnya,Mayo dan Spanos (2006), popper (1959)]. Banyak ilmuwan dan filsuf, terutama
Bayesian, menemukan pendekatan ini tidak memuaskan untuk setidaknya dua alasan
[misalnya,Howson dan Urbach (2005), Jeffreys (1939)].
1. Hipotesis Satu Sisi Terhadap Alternatif Satu Sisi pada Keluarga Monoton Likelihood
Ratio
Kami memulai bagian ini dengan definisi tes UMP.
Definisi
Sebuah tes φ adalah tes UMP pada tingkat α untuk H 0 : q ∈ q 0 vs H 1 : q ∈ q 1 jika
(Saya) supθ∈Θ0Eθ[φ(x)]≤α, dan
Meskipun persyaratan (ii) sangat ketat, tes UMP memang ada dalam jenis situasi tertentu. Pada
bagian sebelumnya kita telah melihat bahwa untuk Poisson ( θ ), tes MP di
tingkat α untuk H 0 : θ = θ 0 vsH1:θ=θ1>θ0memiliki sifat kuat menjadi tingkat UMP α tes
untuk komposit hipotesis H 0 : θ ≤ θ 0 vs alternatif komposit H 1 : θ > θ 0 . Ini sebenarnya
berlaku dalam konteks yang jauh lebih luas.
Definisi
Mari { P θ , θ ∈ q } menjadi keluarga probabilitas pada (x,SEBUAH)dan biarkan p q menyatakan
pdf atau PMF sesuai dengan P θ manaΘ=Ratau Θ adalah dalam intervalR. Seperti keluarga
{ p θ } dikatakan rasio monoton kemungkinan (MLR) keluarga jika terdapat bernilai real
statistik T ( x ) sehingga untuk setiap θ 1 < θ 2 di Θ ,Pθ2(x)/Pθ1(x)adalah fungsi tak
menurun dari T ( x ). [JikaPθ1(x)=0<Pθ2(x), mendefinisikan Pθ2(x)/Pθ1(x)=+∞.]
Soal
Membiarkan Pθ(x)=C(θ)exp[Q(θ)T(x)]H(x)di mana Q ( θ ) adalah fungsi
nondecreasing. Kemudian { p θ } adalah keluarga MLR. Ini termasuk
(sebuah) Pθ(x)=(2πσ2)-n/2exp-12σ2Σ1nxSaya-θ2, xSaya∈R, θ∈R, Σ 2 tetap.
(B) Pθ(x)=(2πθ)-n/2exp-12θΣ1nxSaya-μ2, xSaya∈R, θ∈R+, Μ tetap.
(C)Pθ(x)=e-nθθΣ1nxSaya/Π1nxSaya!, xSaya∈0,1,2,…, θ∈R+.
(D)Pθ(x)=θΣ1nxSaya(1-θ)n-Σ1nxSaya, xSaya∈0,1, Q ∈ (0, 1).
Metode Bayesian Subyektif telah lama memberi para ilmuwan mekanisme formal untuk
menilai probabilitas bahwa teori standar itu benar. Sayangnya, prosedur pengujian Bayesian
subjektif belum—dan kemungkinan besar tidak akan pernah diterima secara umum oleh
komunitas ilmiah. Dalam sebagian besar masalah pengujian, kisaran pendapat ilmiah mengenai
besarnya pelanggaran dari teori standar terlalu besar untuk membuat laporan satu faktor Bayes
subjektif bermanfaat. Selanjutnya, jurnal ilmiah telah menunjukkan keengganan untuk
mengganti laporan satuP-nilai dengan kisaran faktor Bayes yang ditentukan secara subjektif atau
probabilitas model posterior. Mengingat kenyataan ini, Bayesian subjektif mungkin menganggap
UMPBT berguna untuk mengkomunikasikan hasil tes Bayesian ke nonBayesian, bahkan ketika
UMPBT hanya salah satu dari beberapa tes Bayesian yang dilaporkan.
Seperti yang ditunjukkan dalamJohnson dan Rossell (2010), namun, penggunaan prior
alternatif lokal mempersulit pengumpulan bukti yang mendukung hipotesis nol yang benar. Ini
berarti bahwa banyak metode Bayesian objektif hanya sedikit lebih baik daripada uji signifikansi
klasik dalam meringkas bukti yang mendukung hipotesis nol. Untuk ukuran sampel kecil hingga
sedang, UMPBT menghasilkan hipotesis alternatif yang sesuai dengan kepadatan alternatif
alternatif nonlokal, yang berarti bahwa mereka mampu untuk memberikan ringkasan yang lebih
seimbang dari bukti yang dikumpulkan untuk mendukung hipotesis alternatif yang benar dan nol.
UMPBT juga memiliki sifat-sifat tertentu yang tidak menguntungkan.
Seperti banyak metode Bayesian objektif, UMPBT dapat melanggar prinsip kemungkinan, dan
perilakunya dalam pengaturan sampel besar dapat menyebabkan inkonsistensi jika ambang batas bukti
dipertahankan konstan. Dan hipotesis alternatif yang dihasilkan oleh UMPBT tidak kabur atau
noninformatif. Komentar dan diskusi lebih lanjut mengenai masalah ini disediakan di bawah ini. Untuk
mendefinisikan UMPBT, ada baiknya untuk terlebih dahulu meninjau sifat dasar uji hipotesis Bayesian.
Berbeda dengan uji hipotesis statistik klasik, uji hipotesis Bayesian didasarkan pada perbandingan
probabilitas posterior yang ditetapkan untuk hipotesis yang bersaing. Dalam tes parametrik, hipotesis
yang bersaing dicirikan oleh kepadatan sebelumnya yang mereka terapkan pada parameter yang
menentukan kepadatan pengambilan sampel yang dimiliki oleh kedua hipotesis. Tes tersebut terdiri dari
fokus artikel ini. Secara khusus, diasumsikan bahwa kemungkinan posterior antara dua hipotesisH1 dan
H0 dapat dinyatakan sebagai
¿ M ( x) P( H 1)
2 ) P H 1 Ix ¿ ¿= 1 x
P H0 I x ¿ M o ( x) P(H O )
dimana BF10(x) = M1(x)/M0(x) adalah faktor Bayes antara hipotesis H1 dan H0,
Ketika tidak ada kemungkinan kebingungan, πSaya (θ | HSaya ) akan dilambangkan lebih
sederhana dengan πSaya (θ). Ruang parameter dilambangkan dengan- dan ruang sampel dengan x .
Logaritma dari faktor Bayes disebut bobot bukti. Semua kepadatan diasumsikan didefinisikan
sehubungan dengan ukuran dasar yang sesuai (misalnya, Lebesgue atau ukuran penghitungan).
yang berarti bahwa bobot bukti yang diharapkan yang mendukung hipotesis alternatif selalu
berkurang ketika π1(θ) berbeda dari πT (θ) (pada himpunan dengan ukuran lebih besar dari 0). Secara
umum, UMPBT yang dijelaskan di bawah ini akan menurunkan bobot rata-rata bukti yang diperoleh
untuk mendukung hipotesis alternatif yang benar.Dengan kata lain, bobot bukti yang dilaporkan dari
UMPBT akan cenderung meremehkan bobot bukti aktual yang diberikan oleh eksperimen yang
mendukung hipotesis alternatif yang benar.
Seperti uji hipotesis statistik klasik, konsekuensi nyata dari uji hipotesis Bayesian sering kali
adalah penolakan terhadap satu hipotesis, katakanlah H0, mendukung yang kedua, katakan H1. Dalam
uji Bayesian, hipotesis nol ditolak jika probabilitas posterior dariH1 melebihi ambang batas tertentu.
Mengingat peluang sebelumnya antara hipotesis, ini setara dengan menentukan ambang batas,
katakanlahγ , di mana faktor Bayes antara H1 dan H0 harus jatuh untuk menolak H0 untuk kepentingan
H1. Oleh karena itu beberapa kepentingan praktis untuk menentukan hipotesis alternatif yang
memaksimalkan probabilitas bahwa faktor Bayes dari tes melebihi ambang batas yang ditentukan.
Dengan motivasi dan notasi ini, sebuah UMPBT(γ ) secara formal dapat didefinisikan sebagai berikut.
DEFINISI. Tes Bayesian yang paling kuat secara seragam untuk ambang batas bukti> 0 mendukung
hipotesis alternatif H1 melawan hipotesis nol tetap H0, dilambangkan dengan UMPBT(γ ), adalah uji
hipotesis Bayesian di mana faktor Bayes untuk pengujian memenuhi pertidaksamaan berikut untuk
setiap: θ T ∈ - dan untuk semua hipotesis alternatif
Dengan kata lain, UMPBT (γ ) adalah tes Bayesian yang hipotesis alternatifnya ditentukan sehingga
memaksimalkan probabilitas bahwa faktor Bayes BF10(x) melebihi ambang batas bukti γ untuk semua
nilai yang mungkin dari parameter penghasil data θ T . Sisa dari artikel ini disusun sebagai berikut. Pada
bagian selanjutnya, UMPBT dijelaskan untuk model keluarga eksponensial satu parameter. Seperti
dalam kasus UMPT, resep umum untuk membangun UMPBT hanya tersedia dalam kelas kepadatan ini.
Teknik khusus untuk mendefinisikan UMPBT atau perkiraan UMPBT di luar kelas ini dijelaskan nanti di
Bagian 4 dan 5.
Asumsikan bahwa {x1, . . . , xn} x adalah iid dengan kepadatan sampling (atau fungsi massa probabilitas
dalam kasus data diskrit) dari bentuk
di mana T (x), h(x), (θ) dan A(θ) adalah fungsi yang diketahui, dan (θ) bersifat monoton. Pertimbangkan
uji satu sisi dari hipotesis nol titikH0 : θ = θ0 terhadap hipotesis alternatif yang sewenang-wenang.
Membiarkanγ menunjukkan ambang batas bukti untuk UMPBT(), dan asumsikan bahwa nilai θ0 telah
diperbaiki. Lemma
Selain itu, mendefinisikan kamu menjadi 1 atau -1 menurut apakah (θ) naik atau turun secara monoton,
masing-masing, dan tentukan v menjadi baik 1 atau -1 menurut apakah hipotesis alternatif
membutuhkan lebih besar dari atau kurang dari0, masing-masing. Kemudian UMPBT(γ ) dapat diperoleh
dengan membatasi dukungan dari1(θ)ke nilai yang termasuk dalam himpunan.
PATAP. Pertimbangkan kasus di mana hipotesis alternatif membutuhkanθ menjadi lebih besar dari θ0
dan (θ) meningkat (sehingga uv = 1), dan biarkan θT menunjukkan parameter yang benar (yaitu,
menghasilkan data) untuk x di bawah (6). Pertimbangkan alternatif sederhana pertama yang
sebelumnya padaθ adalah massa titik di θ1. Kemudian
Oleh karena itu peluang dalam (9) mencapai nilai maksimumnya ketika ruas kanan pertidaksamaan
diperkecil, tanpa memperhatikan distribusi.
HASIL DAN PEMBAHASAN
BERGER, JO dan PERICCHI, LR (1996). Faktor intrinsik Bayes untuk pemilihan model dan
ramalan. J. Amer. Statistik. asosiasi. 91 109-122. MR1394065
BERGER, JO dan SELLKE, T. (1987). Menguji hipotesis nol titik: KetidakcocokanP nilai-nilai
dan bukti. J. Amer. Statistik. asosiasi. 82 112-122.
Penalaran Ilmiah: Pendekatan Bayesian, edisi ke-3. Membuka Pengadilan, Chicago, IL.
JEFFREYS, H. (1939). Teori Probabilitas. Universitas Cambridge Pers, Cambridge