Anda di halaman 1dari 24

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Jurnal Analisis Multivariat 147 (2016) 58–81

Daftar isi tersedia diSainsLangsung

Jurnal Analisis Multivariat


beranda jurnal:www.elsevier.com/locate/jmva

Pita kepercayaan rasio kemungkinan bootstrap untuk fungsi


bertahan hidup di bawah sensor acak dan ekstensi
semiparametriknya
Sundarraman Subramanian
Pusat Matematika dan Statistik Terapan, Departemen Ilmu Matematika, Institut Teknologi New Jersey, Amerika Serikat

info artikel abstrak

Sejarah artikel: Pita kepercayaan simultan untuk fungsi kelangsungan hidup, dari data yang disensor kanan secara acak, dapat dihitung dengan membalikkan fungsi rasio
Diterima 17 Juli 2015 Tersedia kemungkinan berdasarkan ambang batas yang sesuai. Kadang-kadang, bagaimanapun, distribusi asimtotik yang diperlukan tidak dapat dipecahkan, atau ambang
online 14 Januari 2016 batas berdasarkan pendekatan jembatan Brown tidak mudah diperoleh ketika pita kepercayaan simultan hanya pada sub-wilayah yang mungkin atau diinginkan.

Kami memperoleh ambang batas dengan bootstrap (i) fungsi rasio kemungkinan nonparametrik melalui bootstrap data yang disensor dan (ii) fungsi rasio
Klasifikasi subjek AMS 2010: 62F40 kemungkinan semiparametrik yang disesuaikan melalui bootstrap dua tahap yang menggunakan model untuk tahap kedua. Kedua skenario ini masing-masing

didasarkan pada sensor acak standar dan perluasan semiparametriknya yang diperkenalkan oleh Dikta. Kedua bootstrap, yang berbeda dalam cara resampling
62F25
dilakukan, terbukti memiliki validitas asimtotik. Pita kepercayaan masing-masing adalah lingkungan dari estimator Kaplan-Meier yang terkenal dan rekan
62G09
semiparametrik Dikta yang lebih baru dikembangkan. Sebagaimana dibuktikan oleh studi validasi, kedua jenis pita kepercayaan memberikan cakupan yang kira-
62N01
62N02 kira benar. Namun, pita kepercayaan berbasis model lebih ketat daripada pita nonparametrik. Dua studi sensitivitas mengungkapkan bahwa metode berbasis

62N03 model berkinerja baik ketika model regresi biner standar dipasang, menunjukkan ketahanannya terhadap kesalahan spesifikasi serta penerapan praktisnya.

Sebuah ilustrasi diberikan menggunakan data nyata. Sebagaimana dibuktikan oleh studi validasi, kedua jenis pita kepercayaan memberikan cakupan yang kira-kira
Kata kunci:
benar. Namun, pita kepercayaan berbasis model lebih ketat daripada pita nonparametrik. Dua studi sensitivitas mengungkapkan bahwa metode berbasis model
Respon biner
berkinerja baik ketika model regresi biner standar dipasang, menunjukkan ketahanannya terhadap kesalahan spesifikasi serta penerapan praktisnya. Sebuah
Cauchit
ilustrasi diberikan menggunakan data nyata. Sebagaimana dibuktikan oleh studi validasi, kedua jenis pita kepercayaan memberikan cakupan yang kira-kira benar.
Cakupan empiris
Proses Gauss Namun, pita kepercayaan berbasis model lebih ketat daripada pita nonparametrik. Dua studi sensitivitas mengungkapkan bahwa metode berbasis model

Pengganda Lagrange berkinerja baik ketika model regresi biner standar dipasang, menunjukkan ketahanannya terhadap kesalahan spesifikasi serta penerapan praktisnya. Sebuah

Penaksir kemungkinan maksimum ilustrasi diberikan menggunakan data nyata.

©2016 Elsevier Inc. Semua hak dilindungi undang-undang.

1. Perkenalan

Dalam makalah ini, kami mengembangkan pita kepercayaan simultan bootstrap untuk fungsi kelangsungan hidup dari data yang disensor
secara acak menggunakan pendekatan rasio kemungkinan. Tidak seperti interval kepercayaan pointwise, pita kepercayaan simultan bersifat
global, memungkinkan kesimpulan simultan pada banyak titik waktu, menyajikan perkiraan perbedaan perlakuan yang benar di suatu
wilayah, pada gilirannya mempromosikan pengambilan keputusan yang benar. Kami pertama-tama mengembangkan pita kepercayaan di
bawah model sensor acak, yang dianggap sebagai kerangka kerja de facto di mana variabel acak peristiwa dan waktu penyensoran
independen, distribusinya sama sekali tidak ditentukan dan, khususnya, penyensoran tidak informatif. Kami kemudian mengembangkan pita
kepercayaan simultan alternatif dari ekstensi semiparametrik, yang selanjutnya disebut SRCM, kerangka kerja yang menggabungkan sensor
informatif ke dalam sensor acak melalui model probabilitas non-sensor bersyarat dan satu, yang, khususnya, lebih fleksibel daripada
spesifikasi parametrik penuh dari distribusi sensor. Untuk menekankan niat, kami menunjukkan bahwa dorongan utama makalah ini adalah
untuk mengembangkan ambang batas yang valid secara asimtotik untuk menghitung pita kepercayaan nonparametrik serta semiparametrik
melalui rasio kemungkinan.

Alamat email:sundars@njit.edu.

http://dx.doi.org/10.1016/j.jmva.2016.01.002 0047-259X/©2016
Elsevier Inc. Semua hak dilindungi undang-undang.
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 59

MembiarkanTmenunjukkan waktu kegagalan dan biarkanS0(t)menunjukkan fungsi kelangsungan hidup dariT.Band paling percaya diri untukS0di
bawah model sensor acak adalah tipe Wald, berdasarkan batas lemah dari proses Kaplan-Meier yang dinormalisasi [13,25]. Dalam sebuah makalah
penting, Thomas dan Grunkemeier [37] memperkenalkan LR nonparametrik dan membalikkannya untuk mendapatkan interval kepercayaan pointwise
untuk probabilitas kelangsungan hidup, yang memberikan kinerja sampel kecil yang unggul dibandingkan metode berbasis perkiraan normal. Interval
kepercayaan, bagaimanapun, hanya menjamin cakupan yang benar untuk setiap titik yang terisolasi secara terpisah tetapi tidak untuk banyak titik
secara bersama-sama. Melihat [23,1], di mana perbedaan antara interval kepercayaan pointwise dan pita kepercayaan simultan dijelaskan secara lebih
rinci; lihat juga Bagian4, di mana perbedaannya digambarkan lebih lanjut melalui contoh umum yang melibatkan data dua sampel. Hollander dkk. [14]
menggunakan rasio kemungkinan nonparametrik dan mengembangkan pita kepercayaan simultan sebagai ''lingkungan'' di sekitarSn, estimator Kaplan–
Meier dariS0.
Untuk mengatasi masalah dengan tepat, untuk waktu sensor independenCkami menulisX=min(T, C),δ =DIA≤ C), dan asumsikan bahwaτH
adalah sedemikian rupaH(τH) <1, dimanaHadalah fungsi distribusi untukX. MenulisS−(t)=S(t−). Data yang diamati adalah
{(Xsaya,saya),1≤ saya≤ n}, di manaT1, . . . ,Tnapakah waktu kegagalan iid memiliki fungsi bertahan hidup?S0(t), danC1, . . . ,Cnapakah waktu
penyensoran iid tidak bergantung padaTsaya's. MembiarkanΓ menunjukkan set fungsi bertahan hidup yang didukung oleh masa hidup tanpa
sensor dan 0<p <1. Untuk setiap tetapt, Thomas dan Grunkemeier [37] diperoleh interval kepercayaan titik untukS0(t)menggunakan statistik
rasio kemungkinan nonparametrik

sup{Lik(S):S(t)=p, S∈ Γ }
RTG(p, t)= , (1.1)
Suka(Sn)

di mana

-n
Suka(S)= [S−(Xsaya)− S(Xsaya)]δsaya[S(Xsaya)]1−δsaya. (1.2)
saya=1

Asimtotik 100(1)% interval kepercayaan pointwise untukS0(t), 0< <1, diperoleh dengan membalik 2 lnRTG(p, t)
menggunakan ambangχ2 1,α, bagian atas-α kuantil distribusi chi-kuadrat dengan satu derajat kebebasan. Artinya, untuk masing-masing
tetapt, kumpulan poin {p:2 lnRTG(p, t)≤ χ2 1,α}adalah 100(1)% interval kepercayaan pointwise untukS0(t).
Pendekatan Hollander et al. [14] adalah untuk memperluas kerangka "pointwise" Thomas dan Grunkemeier ke semua [0,H], tujuannya
adalah untuk menemukan amplop yang mencakup semua fungsi kelangsungan hidup dengan dukungan selama titik waktu tanpa sensor,
dan yang mencakupS0dengan 100(1)% kepercayaan diri. Hollander dkk [14] 100(1)% pita kepercayaan simultan untuk S0diberikan oleh

BNP= {S(t):2 lnRTG(S(t), t)≤ ρ̃n(t), t[0,H]}, (1.3)

di manaρ̃n(t)adalah ambang batas yang ditentukan oleh(1 +σ 2 n(t))/σn(t),


di manaσ 2 n(t)didefinisikan oleh Persamaan.(2.3), dan persentil
dari supremum yang sesuai dari nilai absolut dari proses jembatan Brown. Perhatikan bahwaσ 2 n(t)adalah perkiraan
varian dari ln(Sn(t)), yang merupakan kuantitas antara ketika menurunkan perkiraan interval kepercayaan untukS0(t).
Untuk memahami tautannya denganρ̃n(t), rasio kemungkinan akar yang ditandatangani perlu diskalakan oleh faktorσn(t)/(1 +σ 2 n(t))memberi

proses jembatan Brown yang membatasi, lihat [14].


Owen [26,27] memberikan perlakuan teoritis pertama dari metode rasio kemungkinan nonparametrik. Untuk data yang disensor,
pekerjaan dasar Li [17] memberikan pembenaran teoritis rasio kemungkinan nonparametrik. Li [18] turunan rasio kemungkinan
nonparametrik berdasarkan pita kepercayaan untuk fungsi kuantil individu. Einmahl dan McKeague [12] generalisasi Li et al.18]
pendekatan kek-contoh kasus dan mengembangkan tabung kepercayaan simultan untuk beberapa plot kuantil. Dalam makalah ini,
kami mengembangkan pita kepercayaan berbasis rasio kemungkinan bootstrap untukS0(t)lebih dari [,t2](0,H]
di bawah kerangka sensor acak serta untuk ekstensi SRCM-nya. Metode nonparametrik dan pasangan semiparametrik yang
diusulkan masing-masing didasarkan pada bootstrap terpisah.
Untuk skenario nonparametrik, tulisLn(S(t), t)≡ -2 lnRTG(S(t), t), yang merupakan fungsi darit, dan memiliki representasi yang diberikan
oleh Persamaan.(2.1), melihat [14]. MenggunakanSn, estimator Kaplan–Meier, proposal pertama kami adalah bootstrap distribusi

Ln(S0(t), t) , t[,t2](0,H].
Kami menentukanρn, ambang batas, menggunakan pendekatan bootstrap kami untuk distribusi supremum dariLn(S0(t), t)
lebih [t1,t2]dikombinasikan dengan fungsi bobot berdasarkanσ 2 n(t). Kami memperoleh

BNP= {S(t):Ln(S(t), t)≤ ρn(t), t[,t2](0,H]}, (1.4)

yang merupakan pita kepercayaan simultan nonparametrik, lihat Bagian2.2untuk pengembangan rinci dari prosedur. Untuk tujuan
ini, kami menggunakan bootstrap data yang disensor [11,2]. Pembenaran asimtotik untuk pendekatan bootstrap dari rasio
kemungkinan nonparametrik dapat diturunkan dengan menggunakan teknik yang kami berikan secara cukup rinci untuk skenario
semiparametrik yang lebih menantang. Pendekatan ini dirinci dalam Bagian2.1dan2.2.
Beralih ke skenario kedua, SRCM menghadirkan kerangka kerja alternatif untuk mendapatkan pita kepercayaan simultan untuk
S0. Dengan mengeksploitasiS, penduga semiparametrik dariS0[8], yang juga efisien semiparametrik [9], pita kepercayaan simultan
tipe Wald untukS0telah dikembangkan [36]. Namun, pita kepercayaan simultan yang dihasilkan tidak didasarkan pada rasio
kemungkinan. Argumen yang menarik dan paling mendasar untuk relevansi SRCM muncul dari pengamatan bahwa,
60 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

di bawah independensi acara dan waktu penyensoran,m(x)=Pr(δ=1|X=x)adalah rasio bahaya waktu kejadian terhadap bahaya total,
yang terakhir adalah jumlah waktu kejadian dan bahaya sensor [8,39]. Pada gilirannya, bahaya penyensoran terkait dengan bahaya
waktu kejadian melalui faktor pengali yang dijelaskan(−log (m)), yang merupakan fungsi mulus dari peluang bersyarat non-sensor
yang diberikanX. Model sensor acak tidak peduli dengan hubungan ini, hanya menggunakan indikator sensor
δ dalam analisis (sensor noninformatif). Bergantian, sebagai penggantiδ, estimator nonparametrik seperti kernel atau estimator
tetangga terdekat dapat digunakan untukm, mempertahankan sensor noninformatif. Namun, pendekatan terakhir tidak menarik
karena (i) ketergantungannya pada bandwidth optimal yang rumit untuk dihitung; (ii) kemungkinan komplikasi dalam analisis rasio
kemungkinan; dan (iii) komplikasi tambahan yang timbul karena estimasi bersyarat ketika beberapa indikator sensor tidak ada. Kami
menggunakan SRCM, yang mengeksploitasi tautan dengan memanfaatkan model untukm(x). Hubungan tersebut menyarankan
penggunaan regresi logistik, yang merupakan alat standar dalam analisis data respons biner. Tsiatis dkk. [38], antara lain,
menunjukkan bahwa pemodelan yang cermat akan memberikan perkiraan yang baik untuk fungsi probabilitas bersyarat, di sinim(x)
. Namun, model yang sesuai dapat digunakan. McCullagh dan Nelder [20] membahas fungsi tautan seperti logistik, probit, log-log
pelengkap, dan log-log. Tautan probit dan Cauchy, yang terakhir juga dikenal sebagai cauchit, bersarang di dalam keluarga tautan
Gosset [16]. Dikta [8] membahas model bahaya proporsional umum, yang muncul ketika peristiwa dan waktu penyensoran masing-
masing didistribusikan Weibull. Morgan dan Smith[24] menggunakan contoh empiris di mana cauchit tampil lebih baik daripada
tautan probit. Dua simulasi kami serta ilustrasi contoh nyata menggunakan tautan cauchit, menghasilkan pita kepercayaan simultan
dengan probabilitas cakupan empiris yang kira-kira benar dan area dan lebar tertutup rata-rata yang lebih kecil.

Oleh karena itu, tentukan modelm(x, )untukm(x), di manaθ ∈ Rkdengan nilai sebenarnyaθ0. Kemudian, ketika modelnya benar
ditentukan,m(x,0)≡ m(x). Dikta [8,9] diperkirakanθ menggunakanθ̂, penaksir kemungkinan maksimumnya dan yang diusulkanS(t), miliknya
penduga fungsi kelangsungan hidup efisien semiparametrik. Menggantiδsayadenganm(Xsaya, )dalam representasi(2.1)menghasilkan L̂(S(t), t)
diberikan oleh Persamaan.(2.14), melihat [34], yang menunjukkan bahwa L̂(S(t), t):=2 lnR(S(t), t)untuk tertentuAD hocstatistik rasio kemungkinanR diberikan oleh
Persamaan.(2.13).
MenggunakanS, proposal kedua kami adalah bootstrap distribusi
L(S0(t), t), t[,t2](0,H].
Kami kemudian mengembangkan pita kepercayaan rasio kemungkinan berbasis model yang kami usulkan untukS0(t)diberikan oleh

BSP= {S: L̂(S(t), t)≤ (t), t[,t2](0,H]}, (1.5)


di mana(t)adalah ambang batas berbasis data yang sesuai, dikalibrasi dari pendekatan bootstrap dari distribusi
supremum dari L̂(S0(t), t)lebih [,t2]dikombinasikan dengan fungsi bobot berdasarkan estimasi varians. Dua pilihan untuk estimasi
varians, yaituσ̂ 2(t)diperoleh dari Persamaan.(2.10)danσ̃ 2(t)diberikan oleh Persamaan.(2.16), menghasilkan dua jenis pita
kepercayaan simultan semiparametrik, yang kami tunjukkan masing-masing sebagai ''SRCM I'' dan ''SRCM II'', lihat Bagian3. Kami
menggunakan bootstrap dua tahap yang diperkenalkan oleh Subramanian dan Zhang [36], yang menggabungkan bootstrap klasik
dengan regenerasi indikator sensor berbasis model [10]. Perhatikan bahwa SRCM memerlukan mekanisme resampling yang
mengeksploitasi informasi yang tersedia melalui model untukm(x); Efron [11] bootstrap data yang disensor tidak efisien untuk
SRCM. Rasio kemungkinan berbasis model pita kepercayaan simultan untukS0dikembangkan di Bagian2.4dan2.6. Termasuk adalah
turunan dari representasi asimtotik untuk rasio kemungkinan penyesuaian semiparametrik dan bukti pembenaran asimtotik dari
pendekatan bootstrap (dua tahap). Ini memerlukan beberapa hasil teoretis baru dan juga memanfaatkan beberapa hasil yang
diturunkan oleh Subramanian dan Zhang [36].
Hollander dkk. [14] mengembangkan pita kepercayaan simultan nonparametrik mereka selama [0,H]. Perhatikan, bagaimanapun, bahwa
validitas rasio kemungkinan berdasarkan pita kepercayaan simultan bergantung padaseragamtingkat konvergensi dari pengali Lagrange.
Tingkat pointwise diturunkan oleh Li [17] dapat diperluas untuk diterapkan secara seragam pada daerah padat yang merupakan himpunan
bagian yang tepat dari [0,H]; khususnya, lebih dari [,H]untukϵ melebihi, tetapi mendekati nol, asalkan ukuran sampel cukup besar. Ekstensi
'penuh' ke [0,H], bagaimanapun, mensyaratkan bahwaΨ0(t), fungsi bahaya kumulatif dariT,perlu dibatasi dari 0 di atas [0,H], yang
bertentangan dengan persyaratan bahwaΨ0(0)=0; melihatLemma 1diberikan dalam Lampiran. Oleh karena itu kami fokus pada [,H], di mana>
0 dapat dipilih sedekat mungkin dengan 0 seperti yang diinginkan untuk ukuran sampel yang cukup besar. Untuk kumpulan data praktis,
bagaimanapun, pita kepercayaan simultan hanya dapat dibangun di atas wilayah yang didukung oleh rentang data yang diamati. Konstruksi
alternatif Hollander et al. [14] ketikkan pita kepercayaan simultan di atas [,H]
akan membutuhkan ketergantungan pada tabel tujuan khusus, khusus untuk jenis pita kepercayaan yang diinginkan (tipe Hall-
Wellner, tipe presisi yang sama), yang perlu dihasilkan [5,6]. Hal ini meningkatkan kerumitan saat menerapkan pita kepercayaan
simultan pada interval sembarang yang mengecualikan titik akhir bawah nol.
Artikel ini disusun sebagai berikut. Kami mengembangkan pita kepercayaan rasio kemungkinan bootstrap di Bagian2. Kami
menyajikan studi validasi, dua studi sensitivitas, dan contoh nyata di Bagian3. Kami menyajikan beberapa ekstensi dan diskusi lebih
lanjut di Bagian4. Pelengkap teknis dirinci dalamLampiran.

2. Pita kepercayaan simultan yang diusulkan

ric bootstrap
mengembangkan non- dan semi-paramet-
Untuk menghilangkan- simultan co- nfidence band (SCB selanjutnya) untukS0(t), kita tentukan
n n n
N(t)= saya=1saya (Xsaya≤ t,saya=1),T(t)= saya=1saya (Xsaya≤ t), danY(t)= saya=1saya (Xsaya≥ t). Mengikuti Hollander et al. [14], HMY
selanjutnya, kami menunjuk lompatan, katakanlah, dariN, oleh1N.
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 61

2.1. Fungsi LR nonparametrik

MembiarkanD(t)=maksimals≤t(1Ñ(s)− Y(s)). Ingat dari HMY bahwaLn(S(t), t)=2 lnRTG(S(t), t), di mana
- - - --
-- - (t)n -- λn(t)
Ln(S(t), t)=2 Y− 1Ñ(s) di 1 + − Ydi 1 + . (2.1)
s≤t Y− 1Ñ(s) s≤t
Y
Di Siniλn(t)=λn(S(t), t)adalah pengali Lagrange yang menyelesaikan persamaan secara unik
- -
- 1Ñ(s)
1 =S(t), (2.2)
s≤t
Y+(t)

pada(D(t),∞). Pilihan ini untukD(t)menjamin bahwa 0≤ 1Ñ(s)/(Y(s)+(t)) <1 untuk semuas≤ t. Pengganda Lagrange yang memecahkan
Persamaan.(2.2)denganS=S0akan dilambangkan denganλn,0(t)≡ λn,0(S0(t), t).
Kecuali ditentukan lain secara eksplisit, kami akan menggunakan∥h∥t2
t1
≡ supt[t1,t2]|h(t)|untuk menunjukkan sup-norma darihlebih [t1,t2].
Namun, kami akan menulis∥h∥ untuk sup-norma darihlebih dari [0,H]. Pendekatan rasio kemungkinan (LR) menetapkan sisi kanan
Persamaan.(2.1)sama dengan nilai ambang dan memecahkanλn(t). Ambang batas biasanya diambil sebagai persentil ke-95 dari
distribusi dari∥Ln(S0(t), t)∥t2 t.Ada
1
dua akar untukλn(t), satu negatif dan satu positif (Thomas dan Grunkemeier [37];
Li [17]; HMY), yang ketika dicolokkan ke Persamaan.(2.2), menghasilkan batas kepercayaan bawah dan atas untukS0(t); untuk lebih jelasnya,
lihat akhir Bagian2.2. Mendefinisikan

- 1Ñ(s)
σn2(t)=n [=HAIp(1)]. (2.3)
s≤t Y(s)(Y(s)− 1Ñ(s))
Dari HMY, kapanS0kontinu, representasi asimtotik untukLn(S0(t), t)diberikan oleh

1- -
Ln(S0(t), t)= n1/2(lnS (tn ) − lnS 0 (t ) ) 2+Haip(1), (2.4)
σn2(t)
seragam untukt[,t2](0,H]. Dimotivasi oleh Persamaan.(2.4), HMY menerapkan pendekatan jembatan Brown untuk distribusi supremum di atas [0,H]dari LR
akar bertanda yang diskalakan untuk mendapatkan ambang batasnya. Validitasnya lebih dari [0,H]tidak konklusif, bagaimanapun, lihat Persamaan.(2.4),
karena hasil keseragaman yang dinyatakan hanya berlaku di atas [,H].

2.2. Pita kepercayaan simultan nonparametrik

Mengikuti bootstrap data tersensor standar, {(X∗ saya,s∗aya),1≤ saya≤ n}diperoleh dengan mensampling ulang data yang diamati
{(Xsaya,saya),1≤ saya≤ n}. Untuk analisis bootstrap, semua kuantitas di Bagian2.1diganti dengan bootstrap yang sesuai
yang. Secara khusus,N∗ dankamu∗ adalah versi bootstrap dariNdankamumasing-masing danD∗(t)=maksimals≤t(1Ñ ∗(s)− kamu∗(s)).
Juga,λ∗n(t)=λ∗ n(S(t),
t)akan menunjukkan pengganda Lagrange bootstrap, yang merupakan solusi unik atas(D∗(t),∞)dari
versi bootstrap dari Persamaan.(2.2), diperoleh dengan mengganti1Ñdankamudengan rekan bootstrap mereka. KapanS=Sn, itu
pengali Lagrange yang sesuai akan dilambangkan denganλ∗ n,0(t)≡ λ∗ n,0(Sn(t), t). Fungsi bootstrap LR nonparametrik,
dilambangkan denganL∗n (S(t), t), juga diperoleh dari Persamaan.(2.1). Pilihan ini untukD∗(t)memastikan bahwa 0≤ 1Ñ∗(s)/(Y∗(s)+(t)) <1
untuk semuas≤ t. Kami menulisPndanEnuntuk ukuran probabilitas dan harapan yang terkait dengan bootstrap. Kemudian, untuk hampir
semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, seragam untukt[t1,t2], dapat ditunjukkan bahwa

1 - n1/2 - --
L∗n(Sn(t), t)= lnS∗n(t)− ln Sn(t ) 2+HaiPn(1). (2.5)
σn2(t)
Bukti dari Persamaan.(2.5)dapat diperoleh dari bukti rinci (lihat bukti untukLemma 1,2, dan3dalamLampiran) yang kami berikan
untuk skenario semiparametrik yang lebih sulit, dan, karenanya, dihilangkan.
Ingatlah bahwa, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, prosesn1/2(S∗ n−Sn)konvergen lemah diD[0,H]ke

batas yang sama dengann1/2(Sn−S)[2]. Membiarkanw(t)menunjukkan fungsi bobot dan biarkanwn(t)menunjukkan perkiraan yang konsisten dariw(t).
Dengan teorema pemetaan kontinu dan Persamaan.(2.4)dan(2.5)maka, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n},
keduanya∥wn(·)L∗n(Sn(·),·)∥t2 dan∥wn(·)Ln(S0(·),·)∥t2 tmemiliki distribusi limit yang sama. Ini, pada gilirannya, memungkinkan kalibrasi
t1 1
persentil dari yang terakhir menggunakan yang pertama. Secara khusus, untuk masing-masingsaya=1, . . . ,n, KapanXsaya[t1,t2]danδsaya=1,

1. Hitungλ∗ n,0(Xsaya), pengganda Lagrange bootstrap, dengan memecahkan versi Persamaan.(2.2), diperoleh dengan mengganti1Ñ,kamudan

Sdalam Persamaan.(2.2)dengan1Ñ∗,kamu∗ danSnmasing-masing.


2. HitungL∗ n(Sn(Xsaya),Xsaya)dan dapatkanB=maksimal{Xi:Xi[t1,t2],δsaya=1}wn(Xsaya)L∗ ),Xsaya).
n(Sn(Xsaya

3. HitungBdi (2)Mkali dan dapatkanqα, 100M(1)dipesanB1, . . . ,BM.


62 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

Gambar 1.Contoh plot fungsi rasio kemungkinan nonparametrik pada lima waktu kejadian.

Membiarkanρn(t)=qα/wn(t). SCB berbasis LR nonparametrik untukS0diberikan oleh

BNP= {S(t):Ln(S(t), t)≤ ρn(t), t[t1,t2](0,H]}. (2.6)


Dalam simulasi yang dilaporkan di Bagian3, kami menggunakanwn(t)=σn(t)/(1 +σ 2 n(t)).

Catatan 1.lompatan dariN∗ merupakan bagian dariN. Oleh karena itu, fungsi pada langkah (1) dan (2) di atas memerlukan
komputasi hanya pada waktu kejadian (yaitu, waktu tanpa sensor).

Perhatikan bahwaρn(t)memiliki diskontinuitas lompatan pada waktu tanpa sensor yang berbedaXsaya[t1,t2]. Untuk setiap tetapt,Ln(S(t), t)≡
Ln(λ,t), dianggap sebagai fungsi dariλ, benar-benar menurun(D(t),0], adalah nol pada 0, dan meningkat selama [0,∞); lebih-lebih lagi,
Ln(λ,t)→ ±∞sebagaiλ → ±∞ (Thomas dan Grunkemeier [37]; Li [17]; HMI). Oleh karena itu, untuk setiapX tanpa sensorsaya, tepat dua
solusi, katakanλL, saya<0<kamu, aku, dapat diperoleh dengan menyelesaikan persamaanLn(λ,Xsaya)=ρn(Xsaya). Batas kepercayaan
nonparametrik konstan sepenggal di atas [Xsaya,·)[t1,t2], Dimana '·'menunjukkan waktu tanpa sensor berikutnya, adalah
- - - - --
- 1Ñ(s) - 1Ñ(s)
1 , 1 . (2.7)
s≤Xi
Y+λL, saya s≤Xi
Y+λkamu, aku

Catatan 2.Untuk kasuswn(t)=1, hasil non SCB ''linier'' parametrik memberikan batas atas yang monoton. Catatan untuk
masing-masing tetaptbahwa pencarian(t)≡ λ, memecahkanLn(S( t), t)≡ Ln(λ,t)=qα, sudah selesai(D(t),∞), lihat Persamaan.(2.2). Menulis
n(λ,t)untuk turunan parsial dariLn(S(t), t)≡ Ln(λ,
Lkan t)dengan hormatλ, ini menyiratkan bahwa dua suku penyebut
dari integran di
-t
d(s)
n(λ,t)=λ
Lkan (2.8)
0 (Y(s)− 1Ñ(s)+)(Y(s)+)
positif; maka tandanyaLkan n(λ,t)adalah sama dengan itu t untukλ. Dengan Persamaan.(2.8), oleh karena itu, |Lkan n(λ,t1)| |Lkan n(λ,t2)|untukt1≤ t2.

Bersama dengan argumen sebelumnya persamaan(2.7), dia berikut bahwa kedua kurva cekung ke atas, dengan kurva s di
Ln(λ,t2)bersarang di dalamLn(λ,t1). Lihat grafik terlampir Gambar 1, dari studi simulasi kami, dariLn(λ,t)sebagai fungsi dariλ
untuk 5 nilai waktu acarat.

Oleh karena itu, saya)1λL, t ≤ λL, t 2<0 dan (ii) 0<kamu, untuk ≤ 2 λkamu, untuk
1.
Namun, (ii) berlaku jika dan hanya jika 0<1a/(b+λkamu, untuk)2≤
1a/(b+λkamu, untuk)≤ 1,
1
dimanasebuahdanbbersifat non-negatif. N Perhatikan bahwa setiap suku dalam produk dari ekspresi kedua di dalam relasi
kurung siku dari Persamaan.(2.7)mematuhith adalah sayaHai notonicityuntukt1<t2. Oleh karena itu, batas atas monoton mengikuti dengan mudah. batas
Untuk fungsi bobot sewenang-wenang, bagaimanapun, tidak monotonatas dapat muncul di bagian ekor.
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 63

Catatan 3.Kasus monotonisitas batas bawah tampaknya kurang transparan. Studi numerik kami menunjukkan bahwa kurangnya batas
bawah monoton mungkin menjadi masalah untuk model sensor acak (RCM) dan SCB berbasis SRCM di dekat 0. Kurangnya batas bawah yang
monoton mungkin disebabkan oleh data yang tidak memadai di dekat 0 yang menyebabkan bootstrap memberikan ambang batas yang
kurang dapat diandalkan (digunakan untuk menghitung dua nilai pengali Lagrange). Ingat juga bahwa tingkat konvergensi
dariλ̂0, taksiran pengali Lagrange, seragam di atas [,H], melihatLemma 1. Saat kami bergerak lebih dekat ke ujung bawah nol, kami membutuhkan lebih
banyak data untuk memperkirakan pengali Lagrange secara akurat.

Catatan 4.Kurangnya monotonitas yang dibahas dalamCatatan 2dan3dapat dengan mudah diatasi, namun. Batas bawah monoton yang lebih
ketat dengan cakupan yang identik dapat dibangun dengan menetapkan nilai maksimum, di antara subset yang menunjukkan kurangnya
monotonisitas, sebagai batas bawah pada semua titik waktu di subset itu. Batas bawah datar di atas subset itu tetapi cakupan dipertahankan
karena monotonisitasS0(t). Begitu juga untuk batas atas dengan modifikasi yang kentara.

2.3. Penaksir fungsi kelangsungan hidup semiparametrik

-n
Kami menulis(t)untuk penduga bahaya kumulatif semiparametrik dariΨ0(t). Ingat ituT(t)= saya=1saya (Xsaya
≤ t).
Dikta [8] penduga semiparametrik dariS0(t)diberikan oleh
- -
-- - - m(s, )1N(s)
S(t):= 1(ds) = 1 , (2.9)
s≤t s≤t
(s)
kamu

di mana1N(s)/Y(s)didefinisikan sebagai 0 ketikaY=0. Dikta [8] menurunkan teorema limit pusat fungsional untuk =n1/2(S− S0)
dan Dikta [9] terbukti efisiensi semiparametrik. Fungsi varians dari proses Gaussian pembatasWpadatadalahS2 0 (t)σ2(t),
di mana
-t -t-t
m2(s,0) (kamu,v)
σ 2(t)= dH+ dH(v)dH(u), (2.10)
0 (1H(s))2 0 0(1H(u)) (1H(v))
(kamu,v)= (lulusan(m(u,0)))⊤ Saya01lulusan(m(v,0)), Lulusan(m(t, ))= [D1(t, ), . . . , Dk(t, )]⊤,Dr(m(t, ))adalah sebagian
turunan darim(t, )dengan hormatθr, r=1, . . . ,k, dan
- -
lulusan(m(X,0))lulusan⊤(m(X,0))
Saya0=E . (2.11)
m(X,0)(1m(X,0))
Kami dilambangkan denganσ̂ 2 (t)estimasi varians diperoleh dengan mengganti jumlah yang tidak diketahui dalam Persamaan.(2.10)dengan perkiraan
standar (empiris).

2.4. Fungsi LR semiparametrik

MembiarkanDmenunjukkan ruang fungsi kelangsungan hidup pada [0,∞)didukung olehX1, . . . ,Xn(semuawaktu yang diamati, tidak disensor serta disensor).
Perhatikan bahwaS∈ D.Untuk apa sajaS∈ D,mendefinisikan

-n
− m(Xi, ),
L(S)= [S−(Xsaya)− S(Xm(Xi
)] , )[S(Xsaya)]1
saya (2.12)
saya=1

yang analog dengan Persamaan.(1.2), tetapi denganm(Xsaya, )sekarang berperan sebagaiδsaya. Subraman [34] menunjukkan bahwaS(t)memaksimalkan
L(S)lebihD.Dalam semangat Persamaan.(1.1), ia mengusulkan statistik LR yang disesuaikan semiparametrik

sup {L(K):K(t)=p, K∈ D}
R (p, t)= . (2.13)
L(Ŝ)
Ingat bahwa L̂(S(t), t):=2 lnR(S(t), t). Untuktetap, asimtotik 100(1)% interval kepercayaan pointwise (PCI) untuk
S0(t)dapat diperoleh dengan membalik menggunakan ambang batas tergantung padaχ2 1,αdan beberapa estimasi varians. MenulisD(t)=

maksimals≤t(m(s, )1N(s)− Y(s)), kita ingat (lihat [34]) itu


- - - - --
-- - (t) - (t)
L(S(t), t)=2 Y− m(s, )1N(s) di 1 + − Ydi 1 + , (2.14)
s≤t Y− m(s, )1N(s) s≤t
Y

di mana(t)=(S(t), t), pengali Lagrange, adalah solusi unik dari


- -
- m(s, )1N(s)
1 =S(t), (2.15)
s≤t
Y+(t)
64 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

pada(D(t),∞). Perhatikan bahwa 0≤ m(s, )1N(s)/(Y(s)+(t)) <1 untuk semuas≤ t. Pengganda Lagrange yang memecahkan Persamaan.(2.15) denganS=S0
akan dilambangkan denganλ̂0(t)≡ (S0(t), t). Mendefinisikan

- m(s, )1N(s)
σ̃ 2(t)=n [=HAIp(1)]. (2.16)
s≤t Y(s)(Y(s)− m(s, )1N(s))
Kami kemudian memiliki analog semiparametrik berikut dari Persamaan.(2.4). Buktinya ada diLampiran.

Teorema 1.seragam untuk t[t1,t2](0,H],


1- - --2
L(S0(t), t)= n1/2 lnS(t)− lnS0(t) + Haip(1). (2.17)
σ̃ 2(t)

Untuk menetapkan justifikasi asimtotik, hasil analog akan diberikan untuk LR semiparametrik bootstrap.

2.5. Bootstrap dua tahap

Bootstrap dua tahap yang diusulkan oleh Subramanian dan Zhang [36] diberikan sebagai berikut:

(1) HasilkanX∗ saya, saya=1, . . . ,n, dariH(t), di manaH(t)adalah estimator empiris dariH(t).
(2) Hasilkanδ∗ saya, saya=1, . . . ,n, dari distribusi Bernoulli yang memiliki peluang suksesm(X∗ , ).
saya

Kami mempertahankan notasiPndanEnuntuk ukuran probabilitas dan harapan yang terkait dengan bootstrap dua tahap. Untuk membuktikan
pembenaran asimtotik di Bagian2.6, kami membuktikan beberapa hasil baru dan mengingat beberapa hasil yang sudah ada. Kami akan mengasumsikan
kondisi keteraturan yang diberikan dalam Lampiran A Subramanian dan Zhang [36], yang sebagian besar pada dasarnya diperkenalkan oleh Di-
kta [8]. Untuk kelengkapan, kondisi ini disertakan di sini. Fungsi kemungkinan log yang dinormalisasi adalah
n
diberikan olehakun(θ)= saya=1w(Xsaya,saya, )/n, di mana

w(Xsaya,saya, )=δsayaln(m(Xsaya, ))+(1δsaya)ln(1m(Xsaya, )),saya=1, . . . ,n. (2.18)

Tulis Lulusan(m(t, ))= [D1(t, ), . . . , Dk(t, )]⊤, di manaDr(m(t, ))adalah turunan parsial darim(t, )dengan hormat
θr, r=1, . . . ,k. Juga tunjukkan turunan parsial orde kedua denganDr, s(·). Dari Teorema 2.1 dari [8], maksimal
.s.
penaksir kemungkinan (MLE)θ̂ ∈ Θ ⊂ Rkadalah solusi terukur dari Grad(ln(θ))=0 memuaskanθ̂ −→
sebuah

θ0. Menulis
w1(x, )=ln(m(x, ))danw2(x, )=ln(1m(x, )). Syarat keteraturannya adalah:
SEBUAH1Untuk 1≤ r, s≤ k, dansaya=1,2, jumlahnyaDr, swsaya(x, )ada di setiapθ ∈ ,x∈ R,danDr(wsaya(·, ))danDr, s(wsaya(·, ))adalah
terukur- le untuk masing-masingθ ∈ Θ. Di sana ada lingkunganV(θ0)⊂ Θ dariθ0dan fungsi terukurM, denganE(M2(X)) <,
2 -2
seperti yang saya=1Dr, s(wsaya(x, ))+ saya=1Dr(wsaya(x, ))≤ M(x)untuk semuaθ ∈ V(θ0),x≥ 0, dan 1≤ r, s≤ k.
SEBUAH2MatriksSaya0didefinisikan dalam Bagian2.3kertas adalah definit positif.
SEBUAH3Fungsinyam(t, )memiliki turunan parsial orde kedua yang berurutan sehubungan denganθ &t.
SEBUAH4Untuk setiapθ ∈ V(θ,0)⊂ 0Θ -τ |d (lulusan(m(x, )))|-≤ M <.
SEBUAH5Untuk 1≤ r≤ kdanx[0,]fungsinyaDr(m(x,0))adalah Lipschitz. Ini berarti bahwa untuk konstanta yang sesuaic, dan apa
sajax, y[0,H], denganH(τH) <1, berikut ini berlaku:

|Dr(x, )− Dr(y, )| c|x− kamu|.

KondisiSEBUAH1,SEBUAH2,SEBUAH3, danSEBUAH5diberikan oleh Dikta [8] untuk membuktikan normalitas asimtotik dariθ̂ dan untuk
menurunkan teorema limit sentral fungsional untuk penduga fungsi kelangsungan hidup berbasis SRCM dariS0(t). KondisiSEBUAH4diberikan
oleh Subramanian dan Zhang [36] untuk menurunkan validitas asimtotik dari bootstrap dua tahap untuk penaksir fungsi kelangsungan hidup
berbasis SRCM dariS0(t), lihat teorema 2 serta proposisi 3 dari makalah ini. KondisiSEBUAH5juga diperlukan untuk bootstrap estimator fungsi
kelangsungan hidup berbasis SRCM dariS0(t). Perhatikan kondisi ituC1dari Subramanian dan Zhang [36] tersirat oleh Teorema 1terbukti di
bawah ini. Selain itu, kita akan membutuhkanKondisi A(di mana,·adalah norma Euclidean) untuk membuktikan Persamaan.(2.20) danProposisi
2:

Kondisi AUntuk lingkunganVθ ⊂ Θ dari


0
θ0, sup(x, )[0,τH]×V0 ∥lulusan(m(x, )∥ <.

Membiarkanθ̂ menunjukkan bootstrap MLE dariθ. Bukti dariTeorema 2diberikan dalamLampiran.


Teorema 2.Untuk hampir semua urutan sampel{(Xsaya,saya),1≤ saya≤ n},Pn(|θ̂ − θ̂|> )=Hai(1), sebagai n→.

MembiarkanNk(µ, )menunjukkan ak-variasikan distribusi normal dengan meanµ dan matriks kovariansΣ. Untuk setiapsaya=1, . . . ,n, menulis
w(Xsaya,saya, )=δsayaln(m(Xsaya, ))+(1δsaya)ln(1m(Xsaya, )). Subramanian dan Zhang [36] terbuktiProposisi 1dinyatakan di bawah ini.

Implikasinya adalah, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, kita punya(θ̂− )=(θ̂− θ0)+HaiPn(n− 1/2 ).
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 65

Menopang-posisi-1.Misalkan m(x, ) ditentukan dengan benar. Untuk hampir semua urutan sampel{(Xsaya,saya),1≤ saya≤ n}, kemudian,

n1/2θ̂ −1
− θ̂ secara asimtotikN k(0,Saya 0).Khususnya,

- - -n
n1/2θ̂
∗ ∗
− θ̂ =n1/2 Saya1
0lulusan (w(X∗saya,saya , ))+HaiPn(1). (2.19)
saya=1


Ekspansi Taylor darim(x, )tentangθ̂, bersama denganKondisi A, hasil

∥m(·, )− m(·, )=HaiPn(1). (2.20)
-n
Perhatikan bahwaH∗(t)= j=1saya (X∗j≤ t)/nmemenuhi teorema Glivenko–Cantelli: Untuk semua barisan sampel {Xsaya,1≤ saya≤ n},
∥H∗ − H=Hai(1)Pnsebuah.s.Lebih-lebih lagi,Teorema 1, Persamaan.(2.20), hukum kuat bilangan besar, dan lemma 3.6 Dikta [8]
menyiratkan proposisi berikut:

Proposisi 2.DibawahKondisiSEBUAH, versi bootstrap dari (t) dan (t), dilambangkan dengan∗(t) dan∗(t) masing-masing, memenuhi, untuk
hampir semua urutan sampel{(Xsaya,saya),1≤ saya≤ n},

∥Ψ̂ ∗ − Ψ̂ =HaiPn( 1), ∥S∗ − S=HaiPn(1).

Tulis∗ =n1/2(Ψ̂∗ − )dan W∗ =n1/2(S∗ − S), versi bootstrap dari =n1/2(Ψ̂− Ψ0)dan masing-masing. Subramanian dan Zhang [36]
terbuktiProposisi 3.

Proposisi 3.Untuk hampir semua urutan sampel{(Xsaya,saya),1≤ saya≤ n},Ẑ∗ (W ˆ ∗)memiliki batas lemah yang sama denganẐ (Ŵ). Lebih-lebih lagi,
untuk hampir semua urutan sampel{(Xsaya,saya),1≤ saya≤ n},∥Ẑ∗∥ (∥Ŵ∗∥)memiliki distribusi limit yang sama dengan∥ẑ∥(∥ŵ∥).

2.6. Pita kepercayaan simultan semiparametrik

Fungsi LR semiparametrik bootstrap L̂∗(S(t), t)=2 lnL∗ (S(t), t)diberikan oleh


- - -
-- ∗
- λ̂∗(t)
L∗ (S(t), t)= kamu∗(s)− m(s, )1N∗(s) di 1 + ∗
s≤t (s)− m(s, )1N∗(s)
kamu∗

- --
- λˆ ∗(t)
− kamu∗ (s)di 1 + , (2.21)
kamu∗(s)
s≤t

danλ̂∗(t)=λ̂∗(S(t), t), pengganda Lagrange bootstrap, adalah solusi unik dari


- ∗ -
- m(s, )1N∗(s)
1 =S(t), (2.22)
st≤
kamu∗(s)+(t)

pada interval(D∗(t),∞), di manaD∗(t)=maksimals≤t(m(s, )1N∗(s)− kamu∗(s)). Pilihan ini untukD∗(t)memastikan bahwa 0≤

m(s, )1N∗(s)/(Y∗(s)+(t)) <1 untuk semuas≤ t. Itu(t)memecahkan Persamaan.(2.22)denganS=Sakan dilambangkan denganλ̂∗ (t)≡ ((t),ˆ ∗t).
0

MenggunakanTeorema 1, dapat ditunjukkan bahwa∥(σ̃∗(t))2− σ̃ 2(t)=HaiPn(1), di mana


- m(s, )1N∗(s)
(σ̃∗(t))2=n ∗ (2.23)
s≤t Y ∗(s)(Y∗(s)− m(s, )1N∗(s))
mendefinisikan versi bootstrap dariσ̃ 2(t). Kami kemudian memiliki analog bootstrap dua tahap berikut:Teorema 1. Buktinya
ada diLampiran.

Teorema 3.Untuk hampir semua urutan sampel{(Xsaya,saya),1≤ saya≤ n}, seragam untuk t[t1,t2](0,H],
- - 1- - --2
L∗ S(t), t= n1/2lnS∗(t)− lnS(t) + HaiPn(1). (2.24)
σ̃ 2(t)

Persamaan.(2.17)dan(2.24), teorema pemetaan kontinu, danProposisi 3menetapkan, untuk hampir semua urutan sampel
{(Xsaya,saya),1≤ saya≤ n}, itu L̂∗(Ŝ(t), t)memiliki distribusi limit yang sama dengan L̂(S0(t), t). Langkah-langkah yang dijelaskan di Bagian2.2,
66 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

dengan modifikasi yang sesuai untuk skenario semiparametrik, sekarang dapat diikuti untuk mendapatkanqα, diperlukan untuk komputasi
SCB semiparametrik. Perhatikan secara khusus bahwaλ̂∗ 0 (t)dan, pada gilirannya, L̂∗(Ŝ(t), t)dihitung padasetiap Xsaya,saya=1, . . . ,n. Itu
LR SCB semiparametrik untukS0diberikan oleh

BSP= {S(t): L̂(S(t), t)≤ (t), t[t1,t2](0,H]}, (2.25)


di mana(t)=qα/ŵ(t), dengan(t)diambil sebagai(t)/(1 +σ̂ 2(t))atau(t)/(1 +σ̃ 2(t)), masing-masing memberikan SCB semiparametrik ''SRCM I'' dan ''SRCM II'',
yang merupakan batas kepercayaan konstan sepenggal-sepenggal atas [Xsaya,Xsaya+1)[t1,t2],saya=1, . . . ,n, mirip dengan Persamaan.(2.7).

Catatan 5.Untuk setiap tetapt, perhatikan bahwa pencarian untuk(t)≡ λ sudah selesai(D(t),∞), lihat Persamaan.(2.15). Menulis L̂kan(λ,t)untuk
turunan parsial dari L̂(S(t), t)L̂(λ,t)dengan hormatλ, ini menyiratkan bahwa dua suku penyebut dari integran dalam
-t
m(s, )
(λ,t)=λ
Lˆkan dN
0 (Y(s)− m(s, )1N(s)+)(Y(s)+)
positif; maka tanda L̂kan(λ,t)adalah sama dengan itu untukλ. Oleh karena itu, L̂(λ,t)cekung ke atas — menurun drastis(D(t),
0], nol pada 0, dan meningkat secara ketat di atas [0,∞). Karena itu ada dua solusi untuk L̂(λ,t)=(t), satu
negatif dan satu positif. Seperti dalam kasus nonparametrik, grafik L̂(λ,t)sebagai fungsi dariλ bersarang terbalik. Sementara SCB
linier memberikan batas atas yang monoton, kasus batas bawah kurang transparan. Kurangnya batas monoton dapat diatasi,
namun, melalui penyesuaian yang telah dibahas diCatatan 4untuk kasus nonparametrik.

3. Studi numerik

Melalui studi simulasi, pertama-tama kami menampilkankeabsahandari SCB baru untuk ukuran sampel praktis (sedang). Kami
menunjukkan bahwa di bawah spesifikasi parametrik yang benar, metode kami memang menghasilkan SCB yang memiliki
probabilitas cakupan empiris (ECP) yang benar. Lebih khusus lagi, kami melaporkan proporsi 2000 SCB, dihitung dari:k=2000 set
data simulasi, yang mencakupS0(t)untuk semuat[t1,t2]. Perbandingan lebih lanjut antarabenarmelakukan SCB maka diperlukan
untuk menentukanterbaikmelakukan metode. Untuk tujuan ini perbandingan didasarkan pada plot persentase pengurangan relatif
(PRR untuk selanjutnya) diperkiraan rata-rata area tertutup(EAEA) danperkiraan lebar rata-rata(EAWs), dari SCB semiparametrik di
atas yang nonparametrik, sebagai fungsi dari tingkat sensor (CR). Secara khusus, pada interval
[xm1, xm][2t , t],kita 2 t2 h
1 dan xm1 danx m2 are waktu uncensored terbesar dan terkecil yang berbeda lebih kecil dan lebih besar darit1
masing-masing,
- - - -
1-k -m2 1-k -m2
EAEA = j 1x j
aku ; EAW = akuj1j ,
k saya=1 j=m1
k saya=1 j=m1

di manaakujmenunjukkan lebar pita yang dihitung pada titikxj,1x j


=xj+1− xj, dan1Sadalah
j
ukuran lompatanS, penduga dari
S, padaxj. Jumlah di dalam kurung berubah dengansayatetapi notasi kami, untuk menjaga hal-hal sederhana, tidak mencerminkannya. Perhatikan bahwa untuk kasus
nonparametrik, jumlah bagian dalam didasarkan pada lebar dan ukuran lompatan yang dihitung pada setiap titik berbeda yang tidak disensor
ke [xm,1 xm],2denganS nmenggantikanS. Setelah studi validasi, kami menyajikan hasil dari dua studi sensitivitas untuk diselidiki
karakteristik operasi SCB yang kami usulkan, di mana model yang salah spesifikasi (cauchit) selalu dipasang untukm. Akhirnya, kami
memberikan ilustrasi contoh nyata.
SCB dihitung di seluruh panjang yang direntang oleh data, dengan peringatan bahwa kita hanya dapat menghitung SCB di mana
data mengizinkan perhitungan nilai pengali Lagrange, untuk menentukan ambang batas serta batas bawah dan atas. Secara
khusus, jika memungkinkan, kami menghitung pasangan terurut(sebuahk,bk),k=1, . . . ,n, seperti yang P(a1≤ S0(X1)≤ b1, . . . ,sebuah
n≤ S0(Xn)≤ bn)≈ 1α. Rentang mencakup (hampir) semua waktu yang diamati untuk SRCM dan waktu peristiwa yang diamati (tanpa
sensor) untuk RCM. Daerah yang dikecualikan terjadi di dekat ekor kiri dan kanan, biasanya titik data tanpa sensor pertama dan
terakhir dalam kasus RCM, di mana kelangkaan data menyebabkan kerusakan metode Brent [30] dari pencarian akar. Untuk RCM,
perhatikan bahwa, karena bentuk fungsi rasio kemungkinan, lihatGambar 1, Metode Brent ideal tetapi mensyaratkan bahwa dua
akar (masing-masing satu untuk batas bawah dan atas) dikurung dalam cut-off masing-masing,
khusus, [D(t),0)dan(0,∞). Di area masalah, fungsi (rasio kemungkinan dikurangi ambang batas) seharusnya
berikan nilai dengan tanda yang berlawanan di ekstremitasD(t)dan 0, tetapi biasanya gagal melakukannya. Ketangguhan ini mungkin karena kurangnya data di dekat
titik-titik yang berperilaku tidak semestinya. Begitu juga untuk SRCM.

3.1. Studi validasi (simulasi)

Waktu kegagalannya adalah Weibull, denganF(x)=1S(x)=1 exp(−(θx)2). Penyensoran dilakukan secara eksponensial dengan mean
1. Kemudian,m(x, ):=P(δ=1|X=x)=2θ2x/(1 + 2θ2x). CR, dinyatakan sebagai fungsi dari parameterθ, diberikan oleh
√ - -- - --
π 1 1
C(θ)= exp 1Φ √ ,
θ 4θ2 θ 2
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 67

Gambar 2.Studi validasi. Probabilitas cakupan empiris (ECP) dari 95% SCB untukS0(t)atas wilayah yang didukung oleh data disajikan.

di mana(x)menunjukkan fungsi distribusi normal standar. Simulasi dijalankan untuk 12 persentase sensor yang berbeda
antara 19% (θ =4.0) dan 44% (θ =1.4). Untuk setiap simulasi yang dijalankan, melibatkan satu nilaiθ, ECP dari SCB yang
diusulkan serta PRR di EAEA dan EAW dari semiparametrik (SRCM) di atas SCB nonparametrik (berbasis RCM) dihitung.
Untuk setiap simulasi, SCB didasarkan pada ukuran sampel 100 dan dihitung berulang kali 2000 kali; nilai kritis untuk
menghitung setiap SCB didasarkan pada ukuran sampel bootstrap 100 dan 1500 ulangan bootstrap. Kami menggunakan
wn=σn//1 +σ 2 n)untuk SCB berbasis RCM, danŵ =/(1 +σ̂ 2)dan/(1 +σ̃ 2)untuk dua jenis SCB berbasis SRCM,
disebut sebagai ''SRCM I'' dan ''SRCM II'' masing-masing. Plot yang disajikan dalamGambar 2.menunjukkan bahwa baik SCB berbasis RCM
maupun SRCM memberikan ECP yang kira-kira benar, mendekati nominal 0,95. Plot yang disajikan dalamGambar. 3dan4menunjukkan bahwa
PRR di EAEA dan EAW dari SCB berbasis SRCM atas SCB berbasis RCM berjumlah antara 4% (untuk 19% CR) dan 10%-11% (untuk 44% CR).

3.2. Studi sensitivitas (simulasi)

Untuk studi pertama, kami memperkenalkan kesalahan spesifikasi darim(x)dengan selalu menyesuaikan model Cauchy

1
mcauchit(x, )= { 0.5 + ar ctan(γ0 + γ1x)} (3.26)
π
ke data respons biner yang, bagaimanapun, adalah genera ted menggunakan modelm(x, )=2θ2x/(1 + 2θ2x), lihat Bagian3.1. dari dua
ECP dan PRR dalam nilai EAEA dan EAW, untuk setiap seluruh belas nilaiθ antara 4 dan 1,4, dihitung selama 0 dan jumlah ulangan adalah
rentang data yang diamati. Ukuran sampel adalah 10 ukuran 2000. Sampel bootstrap sebanyak 1500. Perhatikan bahwa penelitian ini
adalah 100 dan jumlah replika bootstrapt ion dengan SCB hanya mempengaruhi SCB berbasis SRCM; belajar. Plot yang disajikan
berbasis RCM tetap sama seperti pada validasi SCB yang dalamGambar 5, menunjukkan bahwa edisi berbasis SRCM, tetapi, pada
disediakan ECP yang tidak secara signifikan menurunkan plot kenyataannya, mendekati tingkat nominal 95%. Lebih-lebih lagi,
yang disajikan dalamGambar. 6dan7menunjukkan bahwa PRR di EAEA dan EAW dari SCBS berbasis SRCM atas peningkatan peningkatan
sebesar antara 2% dan 6%. Plot menyarankan saya berbasis RCM pada CR yang lebih tinggi.
Untuk studi misspesifikasi kedua, sebuah data alternatif - mekanisme pembangkit diikuti, membutuhkan spesifikasi e minimum
dari distribusiXdan modelnyam. Dengan demikian, untukm diambil sebagai seragam atas(0,1)dan model sebenarnya di siniθ2
diambil sebagaim(t, )=1 exp(− exp(θ1+θ2t)), w antara 4,4 dan ditetapkan pada 5.92 danθ1divariasikan pada kisi nilai es antara 20 dan 44.
2,85 untuk memberikan berbagai persentase sensor Fungsi kelangsungan hidup yang sebenarnya kemudian diberikan oleh
--texp(− exp(θ1+θ2y)) -
S0(t)=(1t)exp dy .
0 1kamu

Untuk masing-masing dari 13 simulasi, ukuran sampel adalah 10 0, jumlah ulangan 2000, dan ukuran sampel bootstrap menguji tautan
dan ulangan masing-masing adalah 100 dan 1500. Kami cocok cauchit untukm, diberikan oleh Persamaan.(3.26), yang menunjukkan
68 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

Gambar 3.Studi validasi. Persentase pengurangan relatif dalam perkiraan area tertutup rata-rata (EAEA) dari dua SCB semiparametrik di atas SCB nonparametrik
(RCM) disajikan.

Gambar 4.Studi validasi. Persentase pengurangan relatif dalam perkiraan lebar erage (EAWs) dari dua SCB semiparametrik di atas (RCM) nonparametrik
av SCB disajikan.

model yang salah ditentukan. ECP dan PRR di EAEA dan EAW nilai SCB berbasis SRCM di atas yang berbasis RCM sekarang melalui
disajikan dalamGambar. 8–10. ECP dari SCB dihitung untuk SRCM sebagian besar di atas 94,5%, dan mendekati nominal 95%
CR yang lebih tinggi. Selanjutnya jika dibandingkan dengan - SCB berbasis, mereka memberikan pengurangan persen di area
RCM sebesar antara 1,5% dan 4,25% dan penurunan i tertutup n lebar rata-rata sebesar antara 5% dan 10%.
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 69

Gambar 5.Studi kesalahan spesifikasi pertama menggunakan tautan cauchit. Probabilitas cakupan empiris (ECP) dari 95% SCB untukS0(t)atas wilayah yang didukung
oleh data disajikan.

Gambar 6.Studi kesalahan spesifikasi pertama menggunakan tautan cauchit. nt pengurangan relatif dalam perkiraan area tertutup rata-rata (EAEAs) dari keduanya
Perce semiparametrik SCB atas (RCM) nonparametrik SCB disajikan.

3.3. Analisis data time-to-first-review JASA (contoh nyata)

HMY menganalisis data yang memberikan tinjauan waktu-ke- 432 makalah yang diserahkan ke Bagian Teori dan Metode JASA adalah
pertama antara 1 Januari 1994 dan 13 Desember 1994. Di siniX jumlah hari antara pengiriman naskah dan g-nya apakah sebuah makalah
ulasan pertama atau tanggal batas akhir, danδ = 1 atau 0 sesuai menerima tinjauan pertama pada tanggal batas d kali, memberikan 36% CR.
atau tidak. Ada 275 kali tanpa sensor dan 157 prosedur sensor [10]Kami menggunakan sampel ulang berbasis model
untuk memeriksa kecukupandari tiga model untuk menyesuaikan data respons biner. Mereka adalah model Cauchy, lihat
70 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

Gambar 7.Studi kesalahan spesifikasi pertama menggunakan tautan cauchit. Persentase pengurangan relatif dalam perkiraan lebar rata-rata (EAW) dari dua SCB
semiparametrik di atas SCB nonparametrik (RCM) disajikan.

Gambar 8.Studi misspesifikasi kedua menggunakan tautan cauchit. Empiris dengan probabilitas cakupan (ECP) dari 95% SCB untukS0(t)atas wilayah yang didukung
data yang disajikan.

Persamaan.(3.26), dan log-log komplementer, logistik, dan p model robit yang diberikan oleh

mLog-log komplementer(x, )=1 exp(− exp(γ0+γ 1x)) , (3.27)


eγ0+γ1x
mLogistik(x, )= , (3.28)
1 +eγ0+γ1x
mProbit(x, )=(γ0+γ1x), (3.29)
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 71

Gambar 9.Studi misspesifikasi kedua menggunakan tautan cauchit. Persentase pengurangan relatif dalam perkiraan area tertutup rata-rata (EAEA) dari dua SCB
semiparametrik di atas SCB nonparametrik (RCM) disajikan.

Gambar 10.Studi kesalahan spesifikasi kedua menggunakan tautan cauchit. t pengurangan relatif dalam perkiraan lebar rata-rata (EAWs) dari dua semiparametrik
Persentase SCB atas (RCM) nonparametrik SCB disajikan.

di mana(x)menunjukkan dis kumulatif normal standar danfungsi iuran. Kami menghitung data yang disajikan Kolmogorov-
statistik uji Cramér–von Mises (CvM) dari o rekanan 5000 Smirnov (KS) dan kemudian menghitung bootstrap mereka (berbasis
kali. Statistik KS dan CvM adalah b regresi [10]. Proporsi model) yang digunakan pada [32] proses empiris yang ditandai
nilai bootstrap 2000 Ada beberapa indikasi bahwa disesuaikan dengan ues biner yang melebihi statistik uji memberikanp
keempat model mungkin -nilai tes. memadai, lihatTabel 1, Dimanap-nilai disajikan.
SCB berbasis RCM dan SRCM disajikan dalam:fi Band g. 11, bersama dengan log-transformed equal precision (EP) dan disesuaikan kembali di
Hall–Wellner (HW). Jika diperlukan, SCB kami dekat ekor untuk memenuhi monotonisitas, seperti yang dibahas dalam
72 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

Gambar 11.Pita kepercayaan untukS0(t). Tautan cauchit digunakan untuk pita semiparametrik.

Tabel 1
Mengamati tingkat signifikansi uji KS dan CvM untuk memeriksa kecukupan model. Statistik uji yang dihitung dari data yang diamati
ditempatkan dalam tanda kurung.

Uji Cauchy Log-log komplementer Logistik Probit

KS 0,1280 (0,3815) 0,1843 (0,3775) 0,1450 (0,3791) 0,1500 (0,3787)


CvM 0,1630 (0,0251) 0,2080 (0,0249) 0,1803 (0,0250) 0,1760 (0,0250)

Meja 2
Persen pengurangan relatif dalam EAEA dan EAW dari pita SRCM I, II, dan RCM di atas pita EP.

Ukuran RCM SRCM I SRCM II

EA EA − 1,70% 9,69% 8,33%


EAW 3,33% 12,38% 12,01%

Tabel 3
Persen pengurangan relatif dalam EAEA dan E AW pita SRCM I, II, RCM, dan HW di atas pita EP.

Ukuran RCM SRCM I SRCM II HW

EA EA 1,00% 10,99% 11,14% − 1,43%


EAW 1,39% 10,23% 10.50% − 0,63%

Catatan 4. Band EP tampil paling baik di dekat ekor, sementara kinerja band HW jauh lebih buruk pada yang dipasangi Cauchym
daerah. Dua SCB berbasis SRCM dikembangkan menggunakan dan tampil lebih baik dari pesaing lainnya
SCB di wilayah yang lebih besar, khususnya, penaksir berbasis berada di antara persentil ke-25 dan ke-80 dari 1−S(t), SRCM-
wilayah yang mewakili 1S0(t).
Karena band HW tampil relatif lebih buruk daripada SCB pesaing lainnya, diMeja 2kami menyajikan PRR di EAEA SRCM
dan EAW dari SCB yang diusulkan di atas band EP Nair. I dan SRCM II SCBS memberikan PRR melebihi 8% di atas EP
Band.
Kami juga mengembangkan semua SCB secara terpisahel y di atas wilayah diwakili antara sekitar tanggal 25 dan 80
persentil dari 1−S(t). Plot, disajikan dalamGambar 12, indi Dari menyatakan bahwa pita SRCM I dan SRCM II tampil lebih baik secara
Tabel 3, mereka memberikan PRR dalam nilai EAEA dan EAW keseluruhan. s melebihi 10% di atas pita EP.
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 73

Gambar 12.SCB jangkauan terbatas untukS0(t)atas wilayah antara persentil ke-80 dan ke-25 dari penaksir fungsi kelangsungan hidup SRCM. Tautan cauchit
digunakan untuk pita semiparametrik.

4. Penutup diskusi dan ekstensi

Prosedur bootstrap, yang diimplementasikan dalam makalah ini secara terpisah untuk skenario nonparametrik dan semiparametrik, memfasilitasi melakukan perbandingan antara dua pendekatan pada '' pijakan yang sama ''. Ini menghilangkan kebutuhan untuk

menyesuaikan dua metode yang berbeda, yang, jika tidak, mungkin diperlukan untuk memastikan studi perbandingan yang tepat. Metode rasio kemungkinan berbasis model menawarkan arah penelitian baru yang masih belum dijelajahi sejauh ini dan, dalam makalah ini, telah

terbukti memberikan alternatif yang menarik untuk membangun pita kepercayaan simultan untuk fungsi kelangsungan hidup dari satu sampel data yang disensor secara acak. Gagasan bahwa peningkatan pita kepercayaan simultan akan muncul sebagai '' lingkungan '' dari penaksir

fungsi kelangsungan hidup yang efisien semiparametrik adalah wawasan penting yang diakui dan dikejar dalam makalah ini. Menjelang akhir ini, metode semiparametrik yang diusulkan bertujuan untuk mengeksploitasi kekuatan model-model yang tersedia dan prosedur-prosedur

model-fitting yang baik untuk data respon biner untuk menghasilkan pita kepercayaan simultan semiparametrik yang lebih informatif. Untuk menguji validitas metode semiparametrik, kami melakukan studi simulasi yang menggabungkan spesifikasi parametrik yang benar, yang

berhasil menghasilkan pita kepercayaan simultan yang memiliki cakupan yang diinginkan. Untuk menunjukkan penerapannya untuk analisis data praktis, kami melakukan dua studi sensitivitas di mana masing-masing kami memasang model cauchit ke data respons biner yang, pada

kenyataannya, dihasilkan dari model yang berbeda, dan menemukan bahwa pita kepercayaan simultan yang diusulkan masih memberikan cakupan yang memadai, mendekati tingkat nominal. semiparametrik kami melakukan studi simulasi yang menggabungkan spesifikasi

parametrik yang benar, yang berhasil menghasilkan pita kepercayaan simultan yang memiliki cakupan yang diinginkan. Untuk menunjukkan penerapannya untuk analisis data praktis, kami melakukan dua studi sensitivitas di mana masing-masing kami memasang model cauchit ke

data respons biner yang, pada kenyataannya, dihasilkan dari model yang berbeda, dan menemukan bahwa pita kepercayaan simultan yang diusulkan masih memberikan cakupan yang memadai, mendekati tingkat nominal. semiparametrik kami melakukan studi simulasi yang

menggabungkan spesifikasi parametrik yang benar, yang berhasil menghasilkan pita kepercayaan simultan yang memiliki cakupan yang diinginkan. Untuk menunjukkan penerapannya untuk analisis data praktis, kami melakukan dua studi sensitivitas di mana masing-masing kami

memasang model cauchit ke data respons biner yang, pada kenyataannya, dihasilkan dari model yang berbeda, dan menemukan bahwa pita kepercayaan simultan yang diusulkan masih memberikan cakupan yang memadai, mendekati tingkat nominal. semiparametrik pada

kenyataannya, dihasilkan dari model yang berbeda, dan menemukan bahwa pita kepercayaan simultan yang diusulkan masih memberikan cakupan yang memadai, mendekati tingkat nominal. semiparametrik pada kenyataannya, dihasilkan dari model yang berbeda, dan menemukan

bahwa pita kepercayaan simultan yang diusulkan masih memberikan cakupan yang memadai, mendekati tingkat nominal. semiparametrik

pita kepercayaan simultan ditemukan selalu ti pita, dalam hal lebih baik daripada kepercayaan simultan nonparametrik yang diusulkan
menghasilkan tingkat sensor tertutup rata-rata yang lebih kecil. Inikemudahan dan lebar, dengan pengurangan yang cukup besar dibuktikan pada
seharusnya tidak mengejutkan, karena, yang memiliki dukungan sensor yang lebih tinggi agak berat, estimator Kaplan-Meier, t wilayah karena
hanya pada titik yang tidak disensor, dapat menunjukkan fla itu dapat berkontribusi terhadap kurang informatif e estimator fungsi
nonparametriks pita kepercayaan simultan. Sejak titik waktu yang kelangsungan hidup semiparametrik memiliki dukungan sama sekali model
diamati (disensor atau tidak disensor), semipara seperti batasan sensor acak metrik memiliki potensi yang baik untuk menghindari penerapan
ketika ada sensor berat. Pita kepercayaan impl kami memberi kedua jenis rasio kemungkinan berdasarkan kemampuan simultan untuk
pengguna opsi dan fleksibilitas memilih salah satu yang paling sesuai dengan kebutuhan pengguna. h,
Penting untuk dicatat bahwa pendekatan semiparametrik meskipun memperkenalkan sensor informatif, berbeda dari Memang, karena
langsung (parametrik) pemodelan distribusi sensor. model distribusiXtidak ditentukan,semiparametrik re mungkin lebih sedikit bahaya
diindikasikan untuk distribusi sensor, sehingga ketika model menggoda dengan misspesifikasi daripada distribusi ing. Menariknya,
(parametrik) digunakan untukt sensor yang benar sensor bertentangan dengan persepsi populer, distribusi waktu dan distribusi waktu
informatif dapat terwujud bahkan ketika acara t berbagi sensor tidak memiliki waktu oring masing-masing Weibull didistribusikan,m(x)
parameter. Khususnya, ketika kegagalan dan cens digeneralisasikan
proporsional bahaya, lihat Contoh 2.9 dari Dikta [8].
Terbukti, keberhasilan pendekatan berbasis model didasarkan pada kemampuan pengguna untuk menyediakan model
adalah untuk probabilitas non-sensor bersyarat mengingatwaktu yang tepat. Untuk analisis data respons biner, bagaimanapun,
o ada sejumlah model untuk dipilih, suksesh sebagai log log-log komplementer yang khas, bahaya proporsional umum,
74 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

probit, cauchit, antara lain. Seperti yang ditunjukkan oleh Koenker dan Yoon [16], yang memberikan beberapa komentar tentang model
cauchit, baik probit dan cauchit bersarang di dalam keluarga tautan Gosset. Pencarian model yang tepat dapat dipersempit dengan
membuang model yang tidak sesuai menggunakan metode pengecekan model. Sebagaimana dibuktikan oleh studi simulasi lain juga, link
cauchit sering menghasilkan perkiraan yang baik [34,22].
Ketika beberapa indikator sensor hilang, analisis model sensor acak bermasalah. Rasio kemungkinan nonparametrik tidak dapat
diterapkan karena sisi kanan Persamaan.(2.1)dan sisi kiri Persamaan.(2.2)tidak dapat dihitung. Penyesuaian nonparametrik mungkin rumit
dan karenanya mungkin tidak memuaskan, dengan kebutuhan untuk menyediakan estimasi fungsi bersyarat dan bandwidth optimal yang
menyertainya. SRCM tidak menimbulkan batasan seperti itu, karena parameter model dapat diperkirakan secara konsisten dari kasus yang
lengkap [33], memungkinkan seperti sebelumnya perhitungan sisi kanan Persamaan.(2.14)dan sisi kiri Persamaan.(2.15).

Baik pendekatan nonparametrik maupun semiparametrik dapat menghasilkan pita kepercayaan simultan dengan batas
nonmonoton di dekat ekor. Namun, seperti yang dicatat dalam komentar di Bagian2.2, batas monoton yang lebih ketat dapat
diberikan dengan modifikasi sederhana. Ini dimasukkan dalam simulasi dan analisis data.
Matthews [19] memperkenalkan analog data tersensor dari metode Owen–Jager–Wellner [28,15] dan pita kepercayaan simultan
nonparametrik yang diusulkan untukS0(t). Berbeda dengan inversi rasio kemungkinan log yang diskalakan, Matthews [19]
membalikkan statistik Berk–Jones yang dimodifikasi [3], mewakili ''ukuran binomial perbedaan'' antaraSn(t)danS0(t). Berbeda dengan
fungsi distribusi empiris tak bias yang terkait dengan statistik Berk-Jones asli, bagaimanapun, penaksir Kaplan-Meier bias untuk
ukuran sampel yang terbatas, maka efek bias pada pita kepercayaan simultan perlu diselidiki. Selanjutnya, skema pengambilan
sampelnya membutuhkannwaktu peristiwa yang diamati sepenuhnya dan tidak akan dapat diterapkan jika beberapa di antaranya
hilang secara acak. Ukuran sampel acak yang disiratkan oleh mekanisme pembuatan datanya tampaknya berbeda dari pengaturan
model sensor acak standar. Pita kepercayaan simultan sampel besar berdasarkan statistik Berk-Jones yang dimodifikasi memberikan
arahan yang bermanfaat untuk penelitian masa depan.
Pita kepercayaan simultan ''rentang terbatas'' tampaknya cukup penting bagi Matthews [19] untuk menunjukkan bahwa ''Dalam
beberapa pengaturan studi, peneliti mungkin hanya ingin mendapatkan pita kepercayaan simultan untuk interval terbatas pada
skala waktu''. Selain fakta bahwa pita kepercayaan simultan yang diplot pada rentang terbatas memberikan tampilan yang
diperbesar untuk membantu menentukan secara visual pita kepercayaan simultan berkinerja terbaik, orang dapat membayangkan
skenario di mana pita keyakinan simultan rentang terbatas sebenarnya diinginkan. Pita kepercayaan simultan rentang terbatas
seperti itu mungkin dapat memberikan kesimpulan yang lebih andal untuk hipotesis yang dipertanyakan daripada pita kepercayaan
simultan "jangkauan penuh" — hanya karena yang terakhir didasarkan pada ambang yang lebih besar dan, oleh karena itu, terlalu
lebar dan tidak memiliki ''pukulan'' untuk memberikan kesimpulan yang berarti di atas dan di atas apa yang sudah diketahui.
Sebagai contoh,40]. Pita kepercayaan simultan untuk seluruh rentang mungkin tidak memberikan informasi penting baru di dekat
ekor kiri selain memperkuat ''status quo'' bahwa perbedaan tingkat kelangsungan hidup adalah negatif. Lebih jauh lagi, dengan pita
kepercayaan simultan rentang penuh seperti itu, penyembunyian bisa menjadi kemungkinan. Secara khusus, pita kepercayaan
simultan yang dibangun di seluruh rentang mungkin tidak memiliki kekuatan untuk memperbesar pada periode waktu di mana
transplantasi benar-benar menjadi bermanfaat. Faktanya, pita kepercayaan simultan yang tidak dibatasi dapat memberikan
perkiraan konservatif dan menunjukkan perbedaan nol atau negatif pada rentang yang lebih besar, yang dapat sangat
mempengaruhi pengambilan keputusan mengenai jenis perawatan yang akan diberikan kepada pasien. Seperti yang terlihat dari
Gambar 12, pendekatan kami juga dapat memberikan pita kepercayaan simultan pada rentang data yang diinginkan dengan cukup
mudah. Pengguna hanya perlu menentukan jendela di mana pita kepercayaan simultan diinginkan dan perhitungan ambang
bootstrap untuk inversi akan otomatis melalui jendela yang ditentukan.

Argumen untuk inferensi rasio kemungkinan semiparametrik yang diusulkan harus menikmati rezeki yang lebih kuat ketika diterapkan
untuk dua sampel dan, lebih umum,k-pengaturan sampel. Untuk kasus dua sampel, perbedaan fungsi survival antara lain merupakan
parameter kunci. Misalnya, kemanjuran pengobatan (misalnya, dosis rendah) di atas kontrol (dosis standar) dapat diukur dengan
menggunakan perbedaan fungsi kelangsungan hidup. Pendekatan sederhana dan sering digunakan untuk menampilkan area di sekitar
perkiraan titik perbedaan menggunakan interval kepercayaan pointwise dapat menyebabkan penilaian yang buruk mengenai kemanjuran
pengobatan. Memang, karena interval kepercayaan pointwise tidak menangkap variabilitas global yang dilakukan oleh pita kepercayaan
simultan, artefak dari batasan ini adalah bahwa mereka biasanya menunjukkan adanya perbedaan perlakuan pada rentang waktu yang lebih
luas, yang berpotensi memungkinkan penyelidik untuk menyimpulkan secara salah bahwa perawatan lebih baik. (atau lebih rendah) selama
rentang waktu yang lebih besar daripada yang sebenarnya terjadi.21] mengembangkan rasio kemungkinan berdasarkan pita kepercayaan
simultan untuk perbedaan tersebut, menggabungkan rasio kemungkinan nonparametrik dengan estimator Kaplan–Meier plug-in. Mereka
menggunakan bootstrap pengganda Gaussian untuk mendapatkan nilai kritis yang diperlukan untuk konstruksi pita kepercayaan simultan.
Pendekatan semiparametrik untuk masalah ini akan memerlukan penggabungan rasio kemungkinan yang disesuaikan yang kami usulkan
dengan penduga berbasis model sensor acak semiparametrik dariS0(t)sebagai plug-in. Diharapkan bahwa pita kepercayaan simultan
semiparametrik untuk perbedaan, menggunakan ambang batas yang dihitung dengan menerapkan (1) bootstrap pengganda Gaussian dan
(2) bootstrap dua tahap, akan berkinerja lebih baik. Pita kepercayaan simultan berbasis model akan lebih akurat menggambarkan kisaran
perbedaan pengobatan positif atau negatif, memfasilitasi pengambilan keputusan yang lebih baik mengenai jenis pengobatan. Melihat [1]
untuk beberapa penelitian di bagian depan ini.
Metode yang diusulkan dapat diimplementasikan untuk membandingkan dua atau lebih distribusi melalui fungsi kuantil yang
sesuai juga, lihat [12], yang mengembangkan metode plot Q-Q untuk perbandingan dua sampel dan, lebih umum,
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 75

tabung kepercayaan simultan untuk beberapa plot kuantil. Metode plot Q–Q dan tabung kepercayaan simultan untuk beberapa plot kuantil
menggunakan SRCM akan menjadi topik untuk penelitian masa depan.
Kami juga membayangkan metode yang diusulkan memberikan janji untuk memperkuat dan bahkan memodifikasi, dalam kasus
batas, kesimpulan masa lalu dalam studi kanker. Contoh kasus adalah analisis data uji klinis AIDS oleh Parzen, Wei, dan Ying [29],
yang menyimpulkan berdasarkan pita kepercayaan simultan tipe Wald mereka bahwa dosis AZT yang dikurangi setidaknya sama
bagusnya dengan standar dalam hal kelangsungan hidup pasien. Garis nol tidak ada perbedaan hampir tidak termasuk dalam pita
kepercayaan simultan mereka ketika waktu pengamatan antara 575 dan 650 hari, bagaimanapun, lihatGambar 2.dari Parzen dkk. [
29]. Dengan pendekatan semiparametrik yang diusulkan menghasilkan pita kepercayaan simultan yang lebih ketat, analisis kedua,
dan mungkin konklusif, menggunakan metode yang diusulkan tentu akan berguna, karena, berdasarkan Parzen et al.29] studi, dosis
rendah telah ''menjadi terapi tunggal AZT standar untuk mengobati pasien AIDS''.
Seperti yang ditunjukkan oleh peninjau, program komputer umum yang memberikan pita kepercayaan simultan yang diusulkan untuk
berbagai kumpulan data akan sangat membantu. Karena, seperti yang ditunjukkan di atas, sejumlah ekstensi dan aplikasi terkait dari
pendekatan semiparametrik layak dilakukan, dan memang akan menjadi fokus perhatian kami yang berkelanjutan, paket R komprehensif
yang menggabungkan semua pengembangan akan menjadi tujuan masa depan.
Akhirnya, monografi terbaru Claeskens dan Hjort [7] tampaknya relevan untuk masalah kita. Memang, ketidakpastian yang terlibat dalam
spesifikasi parametrik menghasilkan inferensi berikut pemilihan model. Lebih khusus lagi, metode rata-rata model dapat memberikan
penilaian interval kepercayaan yang lebih baik, dan, dengan perluasan, pita kepercayaan simultan. Topik penting ini tidak dikejar di sini, tetapi
akan menjadi arah yang berharga untuk penelitian masa depan.

Ucapan Terima Kasih

Penulis ingin mengucapkan terima kasih kepada editor dan dua wasit yang komentarnya meningkatkan kualitas keseluruhan naskah.

Lampiran

Bukti Teorema 1.Kita akan membutuhkan dua lemma. Lemma pertama menetapkan tingkat konvergensi seragam yang kuat untuk
pengali Lagrangeλ̂0(t)dan lemma kedua memperoleh representasi asimtotik untukλ̂0(t).Lemma 1perlu dibuktikan terlebih dahulu
dari aplikasi ekspansi deret Taylor yang diperlukan dalamLemma 2dan Persamaan.(2.17). Ingatlah bahwa =n1/2(Ψ̂− Ψ0)
dan =n1/2(S− S0). Perhatikan bahwa=Hai((lnn)1/2)sebagai dan=Hai((lnn)1/2)sebagai, lihat, misalnya, Lampiran A
Subramanian dan Kacang [35]. Kami juga mengingatnya∥h∥t2 t≡ supt[t1,t2]|h(t)|menunjukkan norma-lebih dari fungsi apa punhlebih
[t1,t2], dan itu∥h∥ menunjukkan norma-lebih darihlebih dari [0, 1τH].

Lemma 1.Misalkan S0kontinu dan, untuk[t1,t2](0,H],0(t1) >untuk beberapa >0. Ketika m(x, ) ditentukan dengan benar, maka,
hampir pasti,
- -
∥λ̂0∥t2t:=
1
sup |(t)| =Hai
0 (nlnn)1/2.
t[t1,t2]

Bukti.Kapanλ̂0(t) <0 untukt[t1,t2], kita ikuti pembuktian lemma 2.2 dari Li [17] untuk mendapatkan pertidaksamaan lnS0(t)≡ Ψ0(t)≥ (t)
dan (lihat Persamaan (2.12) dari Li [17])
- - - -
n− lnS0(t)− (t) n Ψ0(t)− (t) n1/2∥ẑ∥t2 t1.
|λ̂0(t)| = ≤
− lnS0(t) Ψ0(t) Ψ0(t1)

Oleh karena itu lemma terbukti ketikaλ̂0(t) <0 untukt[t1,t2].


Kapanλ̂0(t) >0, ikuti langkah-langkah yang mengarah ke Persamaan. (2.13) pada halaman 101 dari Li [17] untuk memperoleh

- -
n
(t)+lnS(t)− lnS0(t)≤ Ψ ˆ (t) , (A.1)
n+ |λ̂0(t)|

dan pada gilirannya menyimpulkan bahwa lnS0(t)≥ lnS(t). Selanjutnya, konsistensi seragam yang kuat dari(t)danS(t)lebih dari [0,H]
menyiratkan bahwa, diberikan<0(t1), kita dapat menemukannsangat besar sehingga
-- - - --
- -
-(t)− Ψ0(t)+ lnS(t)− lnS0(t)-< .

Kami kemudian memiliki, seragam untukt[t1,t2](0,H],


- - - -
(t)+lnS(t)− lnS0(t)=Ψ0(t)+(t)− Ψ0(t) + lnS(t)− lnS0(t)
> Ψ0(t1)− >0,
76 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

memungkinkan kita untuk menyimpulkan dari Persamaan.(A.1)itu untuk cukup besarn


- -
nlnS0(t)− lnS(t) n∥ lnSlnS0∥t2 t1.
|λ̂0(t)| ≤
(t)+lnS(t)− lnS0(t) Ψ0(t1)− ϵ

Sekarang terapkan ekspansi Taylor dari lnS(t)tentangS0(t)untuk melengkapi bukti. -

Lemma 2.Di bawah kondisiKata pengantar singkat1, seragam untuk t[t1,t2](0,H],


n- -
λ0̂(t)= lnS(t)− lnS0(t)+Haip(lnn). (A.2)
σ̃ 2(t)

Bukti.Ingat dari Persamaan.(2.15)ituλ̂0(t)≡ (S0(t), t)memuaskanf (λ̂0(t))=lnS0(t), di mana


- -
- m(s, )1N(s)
f (λ):= di 1 .
s≤t
Y+λ

Kemudianf (0)=lnS(t)dan

- m(s, )1N(s)
fkan(λ)= ,
s≤t (Y(s)+)(Y(s)+λ − m(s, )1N(s))
- -
-m(s, )1N(s) 2(Y(s)+)− m(s, )1N(s)
fkan(λ)= - -2 , (A.3)
s≤t Y+λ − m(s, )1N(s) (Y(s)+)2

sehinggafkan(0)=σ̃ 2(t)/n, lihat Persamaan.(2.16). Ekspansi Taylor darif (λ̂0(t))sekitar 0 hasil

ln(S0(t))≡ f (λ̂0(t))=f (0)+λ̂0(t)f kan(0)+λ̂20(t)fkan(η(t))/2,

dimana |(t)| |λ̂0(t)|, dari mana kita sampai pada persamaan


-- - -
n 1
λ̂0(t)= lnS(t)− lnS0(t)+ ( kan(η(t))
λ̂20t)f .
σ̃ 2(t) 2
- -
Persamaan.(A.2)mengikuti dariLemma 1dengan ketentuanfkan(η(t))=HAIp n2, seragam untukt[t1,t2]. Untuk mendapatkan batas atas untuk
fkan(η(t)), kami tunjukkan, untuk semuas≤ t≤ τH, itu

Y+(t)− m(s, )1N(s) >0, (A.4)

dan karenanya,Y+(t) >0, yang sangat penting untuk jumlah penyebut darifkan(η(t)), lihat Persamaan.(A.3). Catatan pertama dari Persamaan.
(2.15)dan definisi dariλ̂0(t), itu, untuk semuas≤ t≤ τH,

Y+λ̂0(t)− m(s, )1N(s) >0. (A.5)

Kapanλ̂0(t) <0, lalu 0> (t) >0(t), dan, karenanya, pertidaksamaan(A.4)mengikuti dari(A.5). Kapanλ̂0(t) >0, lalu 0< (t) <0(t)dan
karenanya(A.4)lagi mengikuti dari(A.5)dan ketidaksetaraan

Y− m(s, )1N(s)≥ Y− 1N(s) >0,untuk semuas≤ t≤ τH. (A.6)

Kami selanjutnya mendapatkan batas bawah seragam untuk jumlah penyebut dalam Persamaan.(A.3). Sejak 1H(τH) >0, pilih 0< <
1H(τH)sedemikian rupa, untuk cukup besarn,

1
[Y(τH)− 1N(τH)]>
n
dan karenanya,Y(τH)/n >untuk cukup besarn. OlehLemma 1, untukncukup besar,< (t)/n <untuk semuat[t1,t2]. Perhatikan bahwa
berikut ini berlaku untuk semuas[0,H]:

Y(t)− 1T(t)≥ Y− 1N(s), s > t. (A.7)

Kemudian, untuk besarn,

Y− m(s, )1N(s)+(t)) > (Y(s)− 1N(s))− tidak≥ (Y(τH)− 1N(τH))− n >0.


S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 77

- -
Sejak s≤t m(s, )1N(s)≤ s≤t1N(s)≤ n, mengikuti dariLemma 1itu

n(2(n+ sup |(t)|)+n) --


t[t1,t2] 1
|f(η(t))
kan | =HAIp . -
{(Y(τH)− 1N(τ H ))− tidak}2(Y(τH)− n ) 2 n2

Bukti Persamaan. (2.17).Terapkan ln(1 +x)=x− x2/2 +x3/3x4/4 +Sapi5)sebagaix→0 untuk mendapatkan
-- -
1 1
− 2 lnL(S0(t), t)=λ̂2 0 (t) −
s≤t Y− m(s,ˆ)1N(s) Y
-- - - - -2
2 - 1
2
1
− λ̂30(t) −
3 s≤t Y− m(s, )1N(s) Y
-
-- - 3 - -3 -
1 1 1 1/2
+ λ̂40(t) − + Pada
p − )
2 s≤t Y− m(s,ˆ)1N(s) Y
≡ Saya1(t)+Saya2(t)+Saya3(t)+Haip(1).

OlehLemma 2dan menggunakan Persamaan.(2.16), seragam untukt[t1,t2],


- - - - -- 2
σ̃ 2(t) σ̃ 2(t) n1/2ln lnn
Saya1(t)=λ̂20(t) =- - Sˆ(t)− lnS0(t) + Hai .
n
p n1/2
σ̃ 2(t)2
t2
Menerapkan Persamaan.(A.7)dan(A.6), laluLemma 1, maka∥Saya 2∥t dibatasi di atas oleh
1
- 3- -- - -
2- 1 1 1 1 - - - -
t
∥λ̂ 0∥t12 + − =Haip (nlnn ) 3/2 HAIpn1 σ̃ 2(t2)/n.
3 Y(t2)− 1N(t2) Y(t 2) t≤t2 Y(t)− m(t, )1T(t) Y(t)
t2
Sejakσ̃ 2(t 2)=HAIp(1), maka∥Saya2∥t 1
=Haip(1). Juga,∥Saya3∥t2 tdibatasi
1
di atas oleh
- -
- - 1 1 1 σ̃ 2(t2)
Haip(nlnn)2 + +
(Y(t2)− 1N(t2))2 Y(t2)(Y(t2)− 1N(t2)) =Hai kamu2(t2) n
- - --- -
=Haip(nlnn)2HAIp n− 2HAIpn− 1 p(1).
Ini melengkapi buktiTeorema 1. -

Bukti Teorema 2.Untuk>0, ayoVη(θ)menunjukkan aη-lingkungan dariθ ∈ Θ̄, penutupanΘ. Membiarkanw1(x, )=lnm(x, )
danw2(x, )=ln(1m(x, )). Ingat bahwa kemungkinan log yang dinormalisasi diberikan oleh

1-n 1-n
akun(θ)= w(X saya,saya, )≡ [δsayaw1(Xsaya, )+( 1δsaya)w2(Xsaya, )].
n saya=1
n saya=1

Dengan hukum kuat bilangan besar (SLLN), kita memilikiakun(θ)−.s. sebuah → LH(θ0, ), di mana
-∞
LH(θ0, )= [m(s,0)w1(s, )+(1m(s,0))w2(s, )]dH(s).
0

FungsinyaLH(θ0,·)memiliki maksimum unik padaθ0, lihat lemma 2.6 dari Stute (1992), danakun(θ0)−.s. sebuah → LH(θ0,0). Ingat itu
fungsi bootstrap log-likelihood diberikan oleh

aku ∗
1-n 1 - n- ∗
-
n(θ)= w(X∗saya,s∗aya, )≡ δsaya
∗ w1(Xsaya, )+(1δ∗ saya )w2(X∗saya, ).
n saya=1
n saya=1

Kami menunjukkan untuk yang besarn, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, ituaku∗ n (θ̂)sewenang-wenang dekat denganLH(θ0,0), sampai
acara dengan kecilPnkemungkinan. Menerapkan harapan berulang dengan mengkondisikan padaX∗,

- - 1 - n- -
Enδ ∗w1(X∗, )+(1δ∗)w2(X∗, ) = m(Xsaya, )w1(Xsaya, )+(1m(Xsaya, ))w2(Xsaya, ). (A.8)
n saya=1

Sejakθ̂ −.s.sebuah→ θ0, kita dapat menerapkan argumen kedekatan seperti pada pembuktian lemma A.1 dari Dikta et al. [10] dan SLLN untuk menyimpulkan
bahwa sisi kanan Persamaan.(A.8)sewenang-wenang dekat denganLH(θ0,0)sebagai; yaitu, diberikan>0, kita dapat menemukann0≡ n0(ϵ)sehingga, untuk
78 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

semuan≥ n0(ϵ),
- -
--1 - n - - -
-
- m(Xsaya, )w1(Xsaya, )+(1m(Xsaya, ))w2(Xsaya, ) − LH(θ0,0) -≤ . (A.9)
-n saya=1
-

Dengan menerapkan ketidaksetaraan Chebyshev, kita dapat menunjukkan bahwaaku∗ n(θ̂)dekat dengan anggota kiri Persamaan.(A.8)hingga acara dengan kecil
Pnkemungkinan.
n(θ̂)sewenang-wenang dekat denganLH(θ0,0), hingga acara dengan
Oleh karena itu, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n},aku∗

kecilPnkemungkinan. Sejakθ̂ memaksimalkanaku∗ n(θ), argumen di atas menunjukkan bahwa cukup untuk menetapkan, untuk hampir semua sampel
urutan {(Xsaya,saya),1≤ saya≤ n}, dan untuk sembarang>0, itu
- -
- -
limPn sup aku ∗
n(θ)− aku∗n(θ̂) <0 = 1. (A.10)
n→∞
θ∈Θ̄\V(θ̂)

Untuk membuktikan Persamaan.(A.10), kita beradaptasi dengan bukti pengaturan Teorema 3.1 dari [31], dengan asumsi kondisi di sana. Mendefinisikan

apa1(z, )=w1(z, )− w1(z, ), apa2(z, )=w2(z, )− w2(z, ).


Untuk setiapθ̃ ∈ Θ̄ \Vη(θ̂), kita memiliki itu, sebagaiη ↓ 0,
- -- -

sup δ∗saya
1 (X∗ , )+(1δ∗)w̄2(X , )↓ δ∗apaX∗ (
1 , )+(1δ∗)w̄ (X ∗, ),
2 Pnsebagai

θ∈V(θ̃)

Dengan teorema konvergensi monoton, sebagaiη ↓ 0,


- -
- - - -
En sup δ∗apa1(X∗, )+(1δ∗)w̄2(X∗, ) → En w̄∗1(X∗, )+(1)w̄2(X∗, ) ∗
,
θ∈V(θ̃)

dengan istilah di sisi kanan atas secara sewenang-wenang dekat denganLH(θ0, )−LH(-θ0, ) <0, untuk cukup besarn, lihat juga
∗¯
Persamaan.(A.8-) dan(A.9). Yaitu dengan memilihη cukup kecil danncukup besar,Ensupθ∈Vη( )[w1(X ∗, )+(1δ∗)w̄2(X∗, )]
benar-benar negatif. Dengan pilihan seperti ituη, cukup besarn, danθ̃ ∈ Θ̄\V (θˆη ), kami sekarang memfokuskan perhitungan kami pada masing-masingθ ∈ Vη(θ̃).
Dengan SLLN, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, kuantitas

aku ∗
1-n - -
n(θ)− aku∗n(θ̂)= w(X∗saya
,∗ saya, )− w( X∗saya,s∗aya, )
n saya=1

-- --
dapat dibuat sedekat mungkin denganE n w(X∗,∗ , )− w(X∗,∗, ) mungkin. Namun,
- -
-- -- - -
En w(X∗,∗, )− w(X∗,∗, ) ≤ En sup w(X∗,∗, )− w(X∗,∗, )
θ∈V(θ̃)
- -
- -
=En sup δ∗apa1(X∗, )+(1δ∗)w̄2(X∗, ) .
θ∈V(θ̃)


Jadi, untuk setiapθ ∈ Vη(θ̃), kami telah menunjukkan bahwa untuk besarnkuantitasaku∗ n(θ)− aku n(θ̂)dibatasi di atas oleh negatif ketat

nilai dan, oleh karena itu, begitu juga supremumnya diambil alihθ ∈ Vη(θ̃). Oleh karena itu, untuk setiapθ̃ ∈ Θ̄ \Vˆ η(θ), simpulkan untuk semua sampel
urutan {(Xsaya,saya),1≤ saya≤ n}itu
- -
- -
limPn sup aku ∗
n(θ)− aku∗n(θ̂) <0 = 1.
n→∞
θ∈V(θ̃)

Dengan kekompakan,Θ̄ \Vη(θ̂)dapat dicakup oleh banyak orangVη(θ̃)membuktikan Persamaan.(A.10). -

Bukti Teorema 3.Di bawah kondisiLemma 1, pertama-tama kita turunkan representasi asimtotik untukλ̂∗ 0(t).

Lemma 3.Untuk hampir semua urutan sampel{(Xsaya,saya),1≤ saya≤ n}, seragam untuk t[t1,t2],
-- - - --
n 1
λ̂∗0(t)= lnS∗(t)− lnS(t) + HAIPn . (A.11)
(σ̃ (t))2 n2
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 79

Bukti.Dari Bagian2.6,λ̂∗ 0 (t)≡ λ̂∗(Ŝ(t), t)memuaskang(λ(t))=lnS(t), di mana


- ∗ -
- m∗(s, )1N∗(s)
g(λ):= di 1 . (A.12)
s≤t
kamu∗(s)+λ

Kemudiang(0)=lnS∗(t)dangkan(0)=(σ̃∗(t))2/n, di mana

- m(s, )1N∗(s)
gkan(λ)= ∗ .
s≤t (Y∗(s)+)(Y∗(s)+λ − m(s, )1N∗(s))

Perhatikan, menurut definisi, bahwaλ̂0∗ (t) > m(s,∗)1N∗(s)−kamu∗(s)untuk semuas≤ t[t1,t2]. Maka, kita memiliki pertidaksamaan berikut, bahwa
kita butuhkan nanti.

kamu∗(s)+λ̂∗0(t)− m(s,∗)1N∗(s) >0,untuk semuas≤ t[t1,t2]. (A.13)

Pertama kami tunjukkan, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, itu |λ̂∗ 0(t)| =HAIPn(n1/2), seragam untukt[t1,t2]. Kita
perlu mempertimbangkan dua kasusλ̂∗ 0(t) <0 danλ̂∗ 0 (t) >0.
Kapanλ̂∗0(t) <0, gunakan Persamaan.(A.12)dan ikuti bukti lemma 2.2 dari Li [17] untuk mendapatkan lnS(t)≥ Ψ̂ ∗(t)dan
- - - - - -
n− lnS(t)− Ψ̂ ∗(t) n − lnS(t)− (t) + n (t)− Ψ̂ ∗(t)
|λ̂0∗(t)| ≤ . (A.14)
− lnS(t) − lnS(t1)
Kemudian ikuti pembuktian lemma 7.1 dari Breslow dan Crowley [4] untuk memperoleh

H(t) (τ H)
− lnSˆ(t)− (t)≤ ≤ , (A.15)
n(1H(t)) n(1(τH))
dengan ketidaksetaraan yang sama untuk data bootstrap. Memasukkan(A.15)ke dalam(A.14)hasil

(τH)/(1(τH))+n/ ∥
1 2∥Ẑ∗ t2
t1.
|ˆλ0∗(t)|
− lnS(t1)
Sekarang terapkanProposisi 3untuk menyimpulkan, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, itu |λ̂∗ 0(t)| =HAIPn(n1/2),
seragam untukt[t1,t2].
Kapanλ̂∗0(t) >0, ikuti langkah-langkah menuju ketidaksamaan (2.13) dari Li [17] untuk memperoleh
- -
n
Ψˆ ∗(t) ≥ Ψ̂ ∗(t)+lnS∗(t)− lnS(t). (A.16)
n+ |λ̂∗0(t)|

Namun, menerapkan mitra bootstrap dari(A.15)ke sisi kanan(A.16)hasil

Hˆ ∗(t2 )
Ψ̂ ∗(t)+lnS∗(t)− lnS(t)≥ - − lnS(t1)≡ C. (A.17)
n(1H∗(t2))
SejakH∗(t2)/(1H∗(t2))=HAI(1),Pnsebuah.s., kita akan mempertimbangkan cukup besarnitu membuatCdi(A.17)sangat positif. Oleh karena itu,
untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n},

Ψ̂ ∗(t)+lnS∗(t)− lnS(t) >0,Pnsebagai (A.18)

Akhirnya, perhatikan dari ketidaksetaraan(A.16), untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, itu lnS(t)≥ lnS∗(t),Pnsebuah.s.
Oleh karena itu, ketidaksetaraan(A.16)dapat dimanipulasi untuk mendapatkan batas atas untuk |λ̂∗ 0(t)|, yang, bersama-sama dengan kontinu
teorema pemetaan, hasil, untuk hampir semua barisan sampel {(Xsaya,saya),1≤ saya≤ n}, tingkat yang diinginkan, seragam untukt[t1,t2]:
- -
nlnS(t)− lnS∗(t) n-- -
-t2 1/2).
|λˆ0∗(t)| ≤ -lnS − lnS∗ - =HAIPn(n
Ψ̂ ∗(t)+lnS∗(t)− lnS(t) C t1

Ingat dari Persamaan.(2.22)ituλ̂∗ 0(t)≡ λ̂∗ 0(Ŝ(t), t)memuaskang(λ̂∗ 0(t))=lnS(t), di mana


- ∗ -
- m(s, )1N∗(s)
g(λ∗):= ln 1 .
s≤t
kamu∗(s)+λ∗
80 S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81

Biarkan |η∗(t)| |λ̂∗ 0(t)|. Seperti pada buktiLemma 2, ekspansi Taylor darig(λ̂∗ 0 (t))sekitar 0 hasil
lnS(t)≡ g(λ̂∗ 0 (t))=g(0)+λ̂∗ t)gkan0((0)+(λ̂∗ 0(t))2gkan(η∗(t))/2.

Perhatikan bahwagkan(0)=(σ̃∗(t))2/ndan itugkan(λ∗)adalah setara bootstrap dari Persamaan.(A.3), di mana kuantitas berbasis
data diganti dengan rekan bootstrapnya. Berikut ini
-- - -
n 1
λ̂∗0(t)= lnS∗(t)− lnS(t) + (λ̂∗0(t))2 gkan
(η∗(t)) .
(σ̃ ∗(t))2 2
Untuk membuktikan dapat diabaikannyagkan(η∗(t)), perhatikan seperti pada buktiLemma 2itu

kamu∗(s)+η∗(t)− m(s, )1N∗(s) >0, untuk semuas≤ t≤ τH.

Oleh karena itu, juga,kamu∗(s)+η∗(t) >0, untuk semuas≤ t≤ τH. Kami kemudian memiliki
- -
- 1 1
|gkan(η∗(t))| = ∗ − 2
s≤t ( (s)+η∗(t)− m(s, )1N∗(s))2
kamu∗ (Y∗(s)+η∗(t))
- -
2 - 1 1
≤ ∗ − .
kamu∗(t)+η∗(t) s≤t Y ∗(s)+(t)− ∗m(s, )1N∗( ) s kamu∗(s)+η∗(t)

Membiarkan(σ̆∗(t))2/nmenunjukkan jumlah di sisi kanan atas. Catatan, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, itu
∥(σ̆∗(t))2− σ̃ 2(t)=HaiPn(1). Oleh karena itu, seragam untukt[t1,t2],

2 (σ̆∗(t ))2 2 - - - - - -
|gkan(η∗(t))| =HAIPn
1
n− HAIPn n− 1 =HAIPn n− 2.-
kamu∗(t)+ η∗(t) n

Komentar.Dengan metode delta fungsional,Proposisi 3, Persamaan.(A.2)dan(A.11), kita punyaλ̂∗ (t)=λ̂0(t)+HaiPn(1).


0

Bukti E-q. (2,24-).Seperti dalam bukti Persamaan.(2.17), kami memiliki, untuk hampir semua urutan sampel {(Xsaya,saya),1≤ saya≤ n}, itu
- 3
− 2 lnL∗ S(t), t= k=1 (t)+HaiPn(1), DimanaSaya∗ k(t)adalah rekan bootstrap dariSayak(t)didefinisikan dalam bukti
Saya∗
k

dari Persamaan.(2.17). Kemudian, olehLemma 3,


- -
- 1 1 2

(σ̆ (t))2
Saya∗
1 (t)=(λ̂∗ 0 (t))2 ∗ − ≡ (λ̂∗ 0(t))
s≤t Y ∗(s)− m(s, )1N∗(s) kamu∗(s) n
(σ̆∗(t))2 - - - - n3 --2
n1/2 lnS∗(t)− lnS(t)+HAIPn /2
, seragam untukt[t1,t2].
=- -2
(σ̃∗(t))2
Seperti dalam bukti Persamaan.(2.17), melamarLemma 3, kita punya
- - 3- -
∥Saya∗ t2 t2
1 1 (σ̃∗(t ))2 2
2∥t1 ≤ ∥λ̂∗ 0∥t1 +
kamu∗(t2)− 1N∗(t2) kamu∗(t2) n
- - - - - 1-HAIPnn− 1
=HAIPnn3/2HAIPnn− =HaiPn(1).

Juga,∥Saya∗ 3∥t t21dibatasi di atas oleh


- -
1 1 1 (σ̃∗(t2))2
HAIPn(n2) + +
(Y∗(t2)− 1N∗(t2))2 kamu∗(t2)(
∗ Y (t2)− 1N∗(t2)) (Y∗(t2)) 2 n
--- -
=HAIPn(n2)HAIPnn2HAIPnn1=HaiPn(1).
Bukti dariTeorema 3selesai. -

Referensi

[1] N. Ahmed, S. Subramanian, Pita kepercayaan simultan semiparametrik untuk perbedaan fungsi kelangsungan hidup, Anal Data Seumur Hidup. (2015) http://
dx.doi.org/10.1007/s10985-015-9348-6.
[2]MG Akritas, Bootstrapping penaksir Kaplan–Meier, J. Amer. Statistik. Asosiasi 81 (1986) 1032–1038.
[3]R. Berk, D. Jones, Statistik uji kecocokan yang mendominasi statistik Kolmogorov, Z. Wahrscheinlichkeitstheor. Verwandte Geb. 47 (1979)
47–59.
[4]NE Breslow, JJ Crowley, Sebuah studi sampel besar dari tabel kehidupan dan perkiraan batas produk di bawah sensor acak, Ann. Statistik. 2 (1973) 437–453.
[5]CF Chung, Rumus untuk probabilitas yang terkait dengan proses jembatan Wiener dan Brown, Laporan teknis 79, Laboratorium Penelitian Statistik dan
Probabilitas, Universitas Carleton, Ottawa, Kanada, 1986.
S. Subramanian / Jurnal Analisis Multivariat 147 (2016) 58–81 81

[6] CF Chung, paket Wiener: paket subrutin untuk menghitung probabilitas yang terkait dengan proses jembatan Wiener dan Brown, Paper 87-12 Geological Survey
of Canada, 1987.
[7]G. Claeskens, NL Hjort, Pemilihan Model dan Model Averaging, Cambridge University Press, 2008.
[8]G. Dikta, Pada model sensor acak semiparametrik, J. Statist. Rencana. Inferensi 66 (1998) 253–279.
[9]G. Dikta, Estimasi efisien asimtotik di bawah model sensor acak semi-parametrik, J. Multivariat Anal. 124 (2014) 10-24.
[10]G. Dikta, M. Kvesic, C. Schmidt, Pendekatan Bootstrap dalam pemeriksaan model untuk data biner, J. Amer. Statistik. Asosiasi 101 (2006) 521–530.
[11]B. Efron, Data yang disensor dan bootstrap, J. Amer. Statistik. Asosiasi 76 (1981) 312–319.
[12]JHJ Einmahl, IW McKeague, tabung Keyakinan untuk beberapa plot kuantil melalui kemungkinan empiris, Ann. Statistik. 27 (1999) 1348–1367.
[13]W. Hall, JA Wellner, Pita kepercayaan untuk kurva kelangsungan hidup dari data yang disensor, Biometrika 67 (1980) 133-143.
[14]M. Hollander, IW McKeague, J. Yang, Kemungkinan band kepercayaan berbasis rasio untuk fungsi kelangsungan hidup, J. Amer. Statistik. Asosiasi 92 (1997) 215–226.
[15]L. Jager, JA Wellner, Uji kecocokan baru: Statistik Berk–Jones terbalik, Laporan Teknis 443, Departemen Statistik, Universitas Washington, 2005.

[16]R. Koenker, J. Yoon, Parametrik link untuk model pilihan biner: Sebuah kolokui Fisherian-Bayesian, J. Econometrics 152 (2009) 120-130.
[17]G. Li, Pada estimasi rasio kemungkinan nonparametrik probabilitas kelangsungan hidup untuk data yang disensor, Statist. Mungkin. Lett. 25 (1995) 95-104.
[18]G. Li, M. Hollander, IW McKeague, J. Yang, Band kepercayaan rasio kemungkinan nonparametrik untuk fungsi kuantil dari data kelangsungan hidup yang tidak lengkap, Ann.
Statistik. 23 (1996) 628–640.
[19]D. Matthews, Pita kepercayaan nonparametrik yang tepat untuk fungsi penyintas, Int. J.Biostat. 9 (2013) 185–204.
[20]P. McCullagh, JA Nelder, Generalized Linear Models, edisi kedua., Chapman & Hall, New York, 1989.
[21]IW McKeague, Y. Zhao, Membandingkan fungsi distribusi melalui kemungkinan empiris, Int. J.Biostat. 1 (2005) Pasal 5.
[22]S. Mondal, S. Subramanian, Model dibantu regresi Cox, J. Multivariat Anal. 123 (2014) 281–303.
[23]S. Mondal, S. Subramanian, Pita kepercayaan simultan untuk regresi Cox dari sensor acak semiparametrik, Anal Data Seumur Hidup. 22 (2016)
122-144.
[24]BJT Morgan, DM Smith, Catatan tentang masalah Wadley dengan overdispersi, Appl. Stat. 41 (1992) 349–354.
[25]V. Nair, Pita kepercayaan untuk fungsi bertahan hidup dengan data yang disensor: studi perbandingan, Technometrics 14 (1984) 265–275.
[26]A. Owen, interval kepercayaan rasio kemungkinan empiris untuk fungsional tunggal, Biometrika 75 (1988) 265-275.
[27]A. Owen, daerah kepercayaan rasio kemungkinan empiris, Ann. Statistik. 18 (1990) 90-120.
[28]A. Owen, pita kepercayaan nonparametrik untuk fungsi distribusi, J. Amer. Statistik. Asosiasi 90 (1995) 516–521.
[29]MI Parzen, LJ Wei, Z. Ying, Interval kepercayaan simultan untuk perbedaan dua fungsi kelangsungan hidup, Scand. J.Stat. 24 (1997) 309–314.
[30]WH Press, BP Flannery, SA Teukolsky, WT Vetterling, Resep Numerik di Fortran 77: Seni Komputasi Ilmiah, edisi kedua., Cambridge University Press, 1992.

[31]W. Stute, Konsistensi MLE yang kuat di bawah sensor acak, Merika 39 (1992) 257–267.
[32]W. Stute, Model nonparametrik memeriksa regresi, Ann. Statistik. 25 (1997) 613–641.
[33]S. Subramanian, Model sensor-indikator yang hilang dari sensor acak, dalam: N. Balakrishnan, CR Rao. (Eds.), Kemajuan dalam Analisis Kelangsungan Hidup, Buku
Pegangan Statistik, Vol. 23, 2004, hlm. 123–141.
[34]S. Subramanian, Interval kepercayaan rasio kemungkinan berbasis model untuk fungsi kelangsungan hidup, Statist. Mungkin. Lett. 82 (2012) 626–635.
[35]S. Subramanian, D. Bean, Estimasi fungsi Hazard dari data homogen yang disensor kanan dengan indikator sensor yang hilang, Stat. Metodologi. 5 (2008) 515–
527.
[36]S. Subramanian, P. Zhang, Pita kepercayaan berbasis model untuk fungsi bertahan hidup, J. Statist. Rencana. Inferensi 143 (2013) 1355–1374.
[37]DR Thomas, GL Grunkemeier, Keyakinan interval estimasi probabilitas kelangsungan hidup untuk data yang disensor, J. Amer. Statistik. Asosiasi 70 (1975) 865–871.
[38]AA Tsiatis, M. Davidian, B. McNeney, Beberapa metode imputasi untuk menguji perbedaan pengobatan dalam distribusi kelangsungan hidup dengan penyebab kegagalan yang
hilang, Biometrika 89 (2002) 238-244.
[39]M. Yuan, Model sensor semiparametrik dengan kovariat, TEST 14 (2005) 1–26.
[40]MJ Zhang, J. Klein, Pita kepercayaan untuk perbedaan dua kurva kelangsungan hidup di bawah model bahaya proporsional, Anal Data Seumur Hidup. 7 (2001) 243-254.

Anda mungkin juga menyukai