Anda di halaman 1dari 4

Fisika 6730 Kesalahan Jackknife Estimasi

Salah satu tujuan pusat analisis data perkiraan ketidakpastian dalam parameter
cocok. Kadang-kadang metode standar untuk mendapatkan kesalahan ini tidak
tersedia atau tidak nyaman. Dalam hal ini kita dapat resor untuk beberapa alat statistik
yang berguna yang telah menjadi populer sejak munculnya komputer cepat. Salah
satunya adalah berlipat disebut''`` (karena kita harus selalu memiliki alat yang
berguna) dan bootstrap yang''`` lainnya. Di sini kita menggambarkan metode berlipat,
yang diciptakan pada tahun 1956 oleh Quenouille dan dikembangkan lebih lanjut
dengan Tukey pada tahun 1957. The bootstrap metode yang lebih baru, yang
dikembangkan oleh Efron di tahun 1970-an, dibahas dalam numerik Resep. Untuk
referensi yang membahas kedua metode, lihat MCK Yang dan David H.
Robinson,Memahami dan Pembelajaran Statistik berdasarkan Komputer, (World
Scientific, Singapura, 1986).

Pertama, dengan cara motivasi, di sini adalah contoh dari teori fisika. Misalkan kita
ingin memperkirakan massa dari sebuah partikel dasar seperti yang diramalkan dalam
simulasi numerik. Massa diperoleh oleh eksponensial cocok untuk data simulasi
ditetapkan sebagai berikut: 

dimana data tersebut diberikan sebagai tabel   nilai untuk nilai integer dari   ,
Sebagai 

Sebenarnya simulasi meludah daftar dari nilai-nilai tersebut dalam satu pengukuran
tunggal, berlangsung selama beberapa saat, dan memindahkan daftar yang lain, dan
seterusnya. Jadi data yang telah ditetapkan seperti 

mana   label daftar pengukuran.

Kita mungkin berpikir yang harus kita lakukan adalah untuk mengambil data mentah

dan membangun sarana   dan standar kesalahan   pada setiap kali   dan
kemudian melakukan sesuai standar minimal chi square. Kita akan mendapatkan nilai-
nilai terbaik untuk parameter   dan   dan kita akan mendapatkan kesalahan dari
kesalahan matriks. Tapi kami punya masalah. Alun-alun sesuai chi standar
mengasumsikan bahwa fluktuasi di titik data secara statistik independen. Ternyata
bahwa dengan simulasi numerik (juga sering masalah dengan data percobaan juga)

fluktuasi dalam data berkorelasi. Artinya, jika   berfluktuasi ke atas, kemungkinan

lebih baik   juga berfluktuasi ke atas. Jadi kita tidak dapat menggunakan rumus
standar untuk chi square. Sekarang mungkin untuk memodifikasi rumus untuk chi
square untuk memperhitungkan tepat dari korelasi berlipat. Yang Namun analisis
menjadi lebih banyak terlibat, jadi satu ingin lebih mengembangkan kepercayaan di
akibatkan kesalahan dalam massa parameter. Itu Enter. Hal ini memberikan alternatif
dan cukup kuat untuk menentukan metode penyebaran kesalahan dari data ke
parameter.

Mulai dari contoh   pengukuran, berlipat dimulai dengan membuang pengukuran


pertama, meninggalkan data berlipat satu set   `` Resampled''nilai-nilai. Analisis
statistik dilakukan pada sampel dikurangi, memberikan nilai diukur dari parameter,
katakanlah   resampling. Kemudian baru yang dilakukan, kali ini membuang
pengukuran kedua, dan nilai diukur baru parameter diperoleh, katakanlah   
. Proses ini diulang untuk setiap set   dalam sampel, sehingga satu set nilai

parameter   adalah. standar error yang diberikan oleh rumus 

(1)

mana   adalah hasil dari pas sampel penuh.

Metode berlipat ini juga mampu memberikan perkiraan sampling bias. Kita mungkin
menghadapi situasi di mana sebuah estimasi parameter cenderung untuk keluar pada
sisi yang tinggi (atau samping rendah) dari nilai sebenarnya jika data sampel terlalu
kecil. Jadi memperkirakan   berasal dari cocok untuk   titik data mungkin lebih
tinggi (atau lebih rendah) dari nilai sebenarnya. Ketika ini terjadi, kita mungkin
berharap bahwa menghapus pengukuran, seperti yang kita lakukan dalam berlipat,
akan meningkatkan bias. Kita mengukur efek ini dengan membandingkan rata-rata
nilai berlipat   , Sebut saja  dengan hasilnya   fitting data full set. Jika ada
perbedaan, kita dapat benar untuk bias menggunakan 

Untuk melihat bagaimana berlipat bekerja, mari kita perhatikan masalah yang jauh

lebih sederhana perhitungan dan standar deviasi mean dari mean sampel acak   
. Pendekatan konvensional memberikan

Pendekatan berlipat menghitung sampel berlipat berarti 

untuk   . Kemudian kita menghitung kesalahan berlipat dalam mean, yang


diberikan oleh
Bandingkan penempatan dari faktor   dan   di sini dengan ekspresi
untuk   . Alasan untuk perbedaan ini adalah yang berarti berlipat sampel
didistribusikan   nilai kali lebih dekat ke berarti daripada asli   , Jadi kita perlu

faktor koreksi   . Bahkan untuk contoh sederhana ini, mudah untuk


menunjukkan bahwa 

Akibatnya kita dapat menunjukkan bahwa sepele 

sehingga prosedur berlipat tidak mendapat apa-apa dalam hal ini sederhana. Tapi
contoh kita menentukan massa dari suatu partikel dasar tidak begitu
sederhana. Perkiraan kesalahan ditemukan dari Persamaan (   ). Ini estimasi
kesalahan tidak mungkin sama dengan kesalahan diperoleh dari analisis chi square
berkorelasi penuh,. Namun kami berharap bahwa dalam batas dari sampel besar jauh,
baik perkiraan harus setuju.

Jadi jika kita mendapatkan dua estimasi kesalahan dan mereka tidak setuju, yang
harus kita percaya? Pendekatan konservatif akan mengambil lebih besar dari dua
perjanjian. Dan kita akan berharap bahwa memperbesar data sampel akan lebih baik
membawa. 

Anda mungkin juga menyukai