Anda di halaman 1dari 19

01 BOOTSTRAPPIN

G
Dalam statistik, Bootstrap Sampling merupakan metode resampling yang
dilakukan berulang-ulang untuk memperkirakan parameter populasi.

Prosedur ini dapat digunakan untuk menghitung standar error, interval


kepercayaan, dan melakukan pengujian hipotesis untuk berbagai jenis
analisis statistik.

Metode Bootstrap pertama kali diperkenalkan oleh Efron pada tahun 1979.
Jika terdapat data dengan jumlah sampel terbatas dan tidak memenuhi asumsi
normalitas, maka alternatif solusi yang dapat digunakan adalah menggunakan
boostrapping. Bootstrap tidak memerlukan asumsi apapun tentang distribusi data yang
dimiliki. Boostrap sudah melakukan resample dari data sampel hingga ribuan kali, dan
menghitung paramater statistik dari hasil resample tersebut. Dikarenakan resample
dilakukan ribuan kali, central limit theorem berbicara di sini, dimana teorema ini
mengatakan bahwa ketika ukuran sampel cukup besar, distribusi sampel dari mean
untuk suatu variabel akan mendekati distribusi normal terlepas dari bagaimana
distribusi variabel itu dalam populasi. Dengan demikian, asumsi normalitas tidak
diperlukan lagi di sini.
Subjek Skor asli Bootsrap 1 Bootsrap 2 Bootsrap 3 Bootsrap 4 Bootsrap 5

A 1 2 1 4 2 2

B 2 3 2 2 3 3

C 3 2 4 3 1 2

D 4 1 3 5 2 4

E 5 4 5 4 4 5

Mean 3 2.4 3 3.6 2.4 3.2

Dari contoh di atas misalkan, didapatkan estimasi rerata dari populasi adalah
2,92; sementara rerata dari data aslinya adalah 3. Dari nilai tersebut kita
mendapatkan nilai bias sebesar |2,92 – 3| = 0,08. 
Gambar di bawah ini merupakan ilustrasi perbandingan data asli, data dengan boostrapping 10 sampel,
dan data dengan boostrapping 1.000 sampel. Pada data original, distribusi data terlihat menceng ke
kanan. Seperti yang terlihat pada gambar, semakin besar resample yang dilakukan, distribusi sampel
akan semakin mendekati bentuk distribusi normal.

Bootstrap 10 Bootstrap 1000


Data Original
sample sample
Untuk menguji hipotesis dengan metode bootstrapping, peneliti perlu
melihat pada nilai taraf kepercayaan (confidence interval). Bootstrap
akan memberikan batas bawah (lower) dan batas atas (upper) dari
taraf kepercayaan yang ada. Suatu analisis dikatakan signifikan jika
batas atas dan batas bawah berada pada satu kutub yang sama, misal
sama-sama memiliki nilai positif atau sama-sama memiliki nilai
negatif. Bootstrap ini dapat dilakukan untuk berbagai uji statistik
seperti korelasi, regresi, t-test, Anova, bahkan SEM. 
  Population
(unknown distribution)

Sample

Resample
 
𝑋1 , … , 𝑋𝑛
  Ulangi sebanyak B kali (B1000)

𝑋 11 ,… ,𝑋 1𝑛
 
𝑋 21 ,… ,𝑋 2𝑛
 
𝑋 𝐵1 ,…, 𝑋 𝐵𝑛
 

~ ∗ ~
𝜃 ∗ ~ ∗
Statistics  
𝜃    
𝜃

B=50 cukup untuk Selang kepercayaan


Untuk sampel berukuran memberikan perkiraan kasar membutuhkan nilai yang
kecil B=25 sudah cukup dari Standard Error tetapi lebih besar dari B, B tidak
“informatif” biasanya yang digunakan kurang dari 500, nilai
B>200 B=1000 direkomendasikan
Prosedur Resampling BOOTSTRAP
Estimasi Bootstrap untuk Rata Rata

 Misalkan dimiliki sampel berukuran n yaitu X1, X2, X3, ...., Xn yang diambil dari suatu
populasi dan adalah estimasi untuk parameter μ berdasar sampel asli.
Pendekatan estimasi bootstrap untuk  μ adalah mean dari distribusi yaitu
𝑩

 
𝝁^ 𝒃
^𝝁 =∑
𝒃=𝟏 𝑩
 Berdasarkan sampel bootstrap denganreplikasi B kali diperoleh , , …, dengan

Variansi Estimator
Standar Error Bootstrap
Bootstrap
  𝑩
𝟏 𝟐
𝑽 ( ^𝝁 )= ∑ 𝝁^ 𝒃 − 𝝁^ )
𝒔𝒆 𝑩( 𝝁^ )=√ 𝑽(^𝝁)
 

𝑩−𝟏 𝒃=𝟏
(
Confidence Interval Estimasi Rata Rata
Pendekatan Normal Pendekatan Persentil
  𝛼 𝛼
Sampel kecil (n < 30) ( (^
𝐹)
−1
( )2
,(^
𝐹)
− 1
( 1−
2 )
 
𝝁
  −𝒕
^ 𝒔𝒆 𝑩 ( ^
𝝁 ) < 𝝁< 𝝁
^ +𝒕 𝒔𝒆 𝑩 ( 𝝁
^) persentil ke () 100 % yang
( 𝒏 − 𝒑 , 𝜶𝟐 ) (𝒏 − 𝒑 , 𝜶𝟐 ) disebut sebagai batas bawah

persentil ke 100 % yang disebut


Sampel besar (n > 30)
sebagai batas atas
𝝁−𝒛
 ^ 𝒔𝒆 𝑩 ( 𝝁
^ ) < 𝝁< 𝝁
^ +𝒛 𝒔𝒆 𝑩 ( ^
𝝁)
( 𝜶𝟐 ) ( 𝜶𝟐 )
Contoh Soal

Suppose we are interested in the wireless network download speed in STIS. It is difficult
for us to examine the entire population in STIS, then the ideology of bootstrap resampling
comes in. The data given on the next page.

Find mean of bootstrap and it’s standard error.


Then find the Confidence interval using 𝜶=𝟓%
Downloaded speed : 9.15, 9.46,
9.25, 9.14, 31.94, 9.55, 20.69,
10.05, 9.19, 5.55 (Mb/s)
Mean bootstrap : 12,52 Mb/s
SE bootstrap : 2,49
Dengan tingkat kepercayaan 95%
dengan menggunakan pendekatan
distribusi normal, rata-rata
kecepatan download wifi STIS
berada pada selang 7.63 sampai
17.41 Mb/s. Sedangkan
berdasarkan pendekatan persentil,
berada pada selang 8.64 hingga
18.33 Mb/s.

Anda mungkin juga menyukai