G
Dalam statistik, Bootstrap Sampling merupakan metode resampling yang
dilakukan berulang-ulang untuk memperkirakan parameter populasi.
Metode Bootstrap pertama kali diperkenalkan oleh Efron pada tahun 1979.
Jika terdapat data dengan jumlah sampel terbatas dan tidak memenuhi asumsi
normalitas, maka alternatif solusi yang dapat digunakan adalah menggunakan
boostrapping. Bootstrap tidak memerlukan asumsi apapun tentang distribusi data yang
dimiliki. Boostrap sudah melakukan resample dari data sampel hingga ribuan kali, dan
menghitung paramater statistik dari hasil resample tersebut. Dikarenakan resample
dilakukan ribuan kali, central limit theorem berbicara di sini, dimana teorema ini
mengatakan bahwa ketika ukuran sampel cukup besar, distribusi sampel dari mean
untuk suatu variabel akan mendekati distribusi normal terlepas dari bagaimana
distribusi variabel itu dalam populasi. Dengan demikian, asumsi normalitas tidak
diperlukan lagi di sini.
Subjek Skor asli Bootsrap 1 Bootsrap 2 Bootsrap 3 Bootsrap 4 Bootsrap 5
A 1 2 1 4 2 2
B 2 3 2 2 3 3
C 3 2 4 3 1 2
D 4 1 3 5 2 4
E 5 4 5 4 4 5
Dari contoh di atas misalkan, didapatkan estimasi rerata dari populasi adalah
2,92; sementara rerata dari data aslinya adalah 3. Dari nilai tersebut kita
mendapatkan nilai bias sebesar |2,92 – 3| = 0,08.
Gambar di bawah ini merupakan ilustrasi perbandingan data asli, data dengan boostrapping 10 sampel,
dan data dengan boostrapping 1.000 sampel. Pada data original, distribusi data terlihat menceng ke
kanan. Seperti yang terlihat pada gambar, semakin besar resample yang dilakukan, distribusi sampel
akan semakin mendekati bentuk distribusi normal.
Sample
Resample
𝑋1 , … , 𝑋𝑛
Ulangi sebanyak B kali (B1000)
𝑋 11 ,… ,𝑋 1𝑛
𝑋 21 ,… ,𝑋 2𝑛
𝑋 𝐵1 ,…, 𝑋 𝐵𝑛
~ ∗ ~
𝜃 ∗ ~ ∗
Statistics
𝜃
𝜃
●
Misalkan dimiliki sampel berukuran n yaitu X1, X2, X3, ...., Xn yang diambil dari suatu
populasi dan adalah estimasi untuk parameter μ berdasar sampel asli.
Pendekatan estimasi bootstrap untuk μ adalah mean dari distribusi yaitu
𝑩
∗
𝝁^ 𝒃
^𝝁 =∑
𝒃=𝟏 𝑩
Berdasarkan sampel bootstrap denganreplikasi B kali diperoleh , , …, dengan
Variansi Estimator
Standar Error Bootstrap
Bootstrap
𝑩
𝟏 𝟐
𝑽 ( ^𝝁 )= ∑ 𝝁^ 𝒃 − 𝝁^ )
𝒔𝒆 𝑩( 𝝁^ )=√ 𝑽(^𝝁)
𝑩−𝟏 𝒃=𝟏
(
Confidence Interval Estimasi Rata Rata
Pendekatan Normal Pendekatan Persentil
𝛼 𝛼
Sampel kecil (n < 30) ( (^
𝐹)
−1
( )2
,(^
𝐹)
− 1
( 1−
2 )
𝝁
−𝒕
^ 𝒔𝒆 𝑩 ( ^
𝝁 ) < 𝝁< 𝝁
^ +𝒕 𝒔𝒆 𝑩 ( 𝝁
^) persentil ke () 100 % yang
( 𝒏 − 𝒑 , 𝜶𝟐 ) (𝒏 − 𝒑 , 𝜶𝟐 ) disebut sebagai batas bawah
Suppose we are interested in the wireless network download speed in STIS. It is difficult
for us to examine the entire population in STIS, then the ideology of bootstrap resampling
comes in. The data given on the next page.