Fisika 6730 Kesalahan Jackknife Estimasi

Fisika 6730 Kesalahan Jackknife Estimasi
Salah satu tujuan pusat analisis data perkiraan ketidakpastian dalam parameter
cocok. Kadang-kadang metode standar untuk mendapatkan kesalahan ini tidak
tersedia atau tidak nyaman. Dalam hal ini kita dapat resor untuk beberapa alat statistik
yang berguna yang telah menjadi populer sejak munculnya komputer cepat. Salah
satunya adalah berlipat disebut''`` (karena kita harus selalu memiliki alat yang
berguna) dan bootstrap yang''`` lainnya. Di sini kita menggambarkan metode berlipat,
yang diciptakan pada tahun 1956 oleh Quenouille dan dikembangkan lebih lanjut
dengan Tukey pada tahun 1957. The bootstrap metode yang lebih baru, yang
dikembangkan oleh Efron di tahun 1970-an, dibahas dalam numerik Resep. Untuk
referensi yang membahas kedua metode, lihat MCK Yang dan David H.
Robinson,Memahami dan Pembelajaran Statistik berdasarkan Komputer, (World
Scientific, Singapura, 1986).
Pertama, dengan cara motivasi, di sini adalah contoh dari teori fisika. Misalkan kita
ingin memperkirakan massa dari sebuah partikel dasar seperti yang diramalkan dalam
simulasi numerik. Massa diperoleh oleh eksponensial cocok untuk data simulasi
ditetapkan sebagai berikut:
dimana data tersebut diberikan sebagai tabel nilai untuk nilai integer dari ,
Sebagai
Sebenarnya simulasi meludah daftar dari nilai-nilai tersebut dalam satu pengukuran
tunggal, berlangsung selama beberapa saat, dan memindahkan daftar yang lain, dan
seterusnya. Jadi data yang telah ditetapkan seperti
mana label daftar pengukuran.
Kita mungkin berpikir yang harus kita lakukan adalah untuk mengambil data mentah
dan membangun sarana dan standar kesalahan pada setiap kali dan
kemudian melakukan sesuai standar minimal chi square. Kita akan mendapatkan nilai-
nilai terbaik untuk parameter dan dan kita akan mendapatkan kesalahan dari
kesalahan matriks. Tapi kami punya masalah. Alun-alun sesuai chi standar
mengasumsikan bahwa fluktuasi di titik data secara statistik independen. Ternyata
bahwa dengan simulasi numerik (juga sering masalah dengan data percobaan juga)
fluktuasi dalam data berkorelasi. Artinya, jika berfluktuasi ke atas, kemungkinan
lebih baik juga berfluktuasi ke atas. Jadi kita tidak dapat menggunakan rumus
standar untuk chi square. Sekarang mungkin untuk memodifikasi rumus untuk chi
square untuk memperhitungkan tepat dari korelasi berlipat. Yang Namun analisis
menjadi lebih banyak terlibat, jadi satu ingin lebih mengembangkan kepercayaan di
akibatkan kesalahan dalam massa parameter. Itu Enter. Hal ini memberikan alternatif
dan cukup kuat untuk menentukan metode penyebaran kesalahan dari data ke
parameter.
Mulai dari contoh pengukuran, berlipat dimulai dengan membuang pengukuran

pertama, meninggalkan data berlipat satu set `` Resampled''nilai-nilai. Analisis
statistik dilakukan pada sampel dikurangi, memberikan nilai diukur dari parameter,
katakanlah resampling. Kemudian baru yang dilakukan, kali ini membuang
pengukuran kedua, dan nilai diukur baru parameter diperoleh, katakanlah
. Proses ini diulang untuk setiap set dalam sampel, sehingga satu set nilai
parameter adalah. standar error yang diberikan oleh rumus
(1)
mana adalah hasil dari pas sampel penuh.
Metode berlipat ini juga mampu memberikan perkiraan sampling bias. Kita mungkin
menghadapi situasi di mana sebuah estimasi parameter cenderung untuk keluar pada
sisi yang tinggi (atau samping rendah) dari nilai sebenarnya jika data sampel terlalu
kecil. Jadi memperkirakan berasal dari cocok untuk titik data mungkin lebih
tinggi (atau lebih rendah) dari nilai sebenarnya. Ketika ini terjadi, kita mungkin
berharap bahwa menghapus pengukuran, seperti yang kita lakukan dalam berlipat,
akan meningkatkan bias. Kita mengukur efek ini dengan membandingkan rata-rata
nilai berlipat , Sebut saja dengan hasilnya fitting data full set. Jika ada
perbedaan, kita dapat benar untuk bias menggunakan
Untuk melihat bagaimana berlipat bekerja, mari kita perhatikan masalah yang jauh
lebih sederhana perhitungan dan standar deviasi mean dari mean sampel acak
. Pendekatan konvensional memberikan
Pendekatan berlipat menghitung sampel berlipat berarti
untuk . Kemudian kita menghitung kesalahan berlipat dalam mean, yang

diberikan oleh
Bandingkan penempatan dari faktor dan di sini dengan ekspresi
untuk . Alasan untuk perbedaan ini adalah yang berarti berlipat sampel
didistribusikan nilai kali lebih dekat ke berarti daripada asli , Jadi kita perlu
faktor koreksi . Bahkan untuk contoh sederhana ini, mudah untuk

menunjukkan bahwa
Akibatnya kita dapat menunjukkan bahwa sepele
sehingga prosedur berlipat tidak mendapat apa-apa dalam hal ini sederhana. Tapi
contoh kita menentukan massa dari suatu partikel dasar tidak begitu
sederhana. Perkiraan kesalahan ditemukan dari Persamaan ( ). Ini estimasi
kesalahan tidak mungkin sama dengan kesalahan diperoleh dari analisis chi square
berkorelasi penuh,. Namun kami berharap bahwa dalam batas dari sampel besar jauh,
baik perkiraan harus setuju.
Jadi jika kita mendapatkan dua estimasi kesalahan dan mereka tidak setuju, yang
harus kita percaya? Pendekatan konservatif akan mengambil lebih besar dari dua
perjanjian. Dan kita akan berharap bahwa memperbesar data sampel akan lebih baik
membawa.

Fisika 6730 Kesalahan Jackknife Estimasi

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Fisika 6730 Kesalahan Jackknife Estimasi

Diunggah oleh

Hak Cipta:

Format Tersedia

Fisika 6730 Kesalahan Jackknife Estimasi

mana label daftar pengukuran.

fluktuasi dalam data berkorelasi. Artinya, jika berfluktuasi ke atas, kemungkinan

Mulai dari contoh pengukuran, berlipat dimulai dengan membuang pengukuran

parameter adalah. standar error yang diberikan oleh rumus

mana adalah hasil dari pas sampel penuh.

Pendekatan berlipat menghitung sampel berlipat berarti

untuk . Kemudian kita menghitung kesalahan berlipat dalam mean, yang

faktor koreksi . Bahkan untuk contoh sederhana ini, mudah untuk

Akibatnya kita dapat menunjukkan bahwa sepele

Anda mungkin juga menyukai