Anda di halaman 1dari 18

TUGAS KELOMPOK 6 MATA KULIAH KAPITA SELEKTA

RESAMPLING

OLEH : 1. Apry Zakaria Ramadhan (0910950023) 2. Evellin Dewi Lusiana 3. Nur Istiqomah 4. Dita F. Aprianti 5. Prawitra Kusumastuti 6. Ridia Nurul Hijjah (0910950037) (0910953007) (0910953023) (0910953041) (0910953043)

PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS BRAWIJAYA MALANG 2012

BAB I PENDAHULUAN

1.1.Latar Belakang

Dalam statistika, penelitian atau pengamatan dilakukan terhadap sampel yaitu sekumpulan individu yang mewakili populasi. Semakin besar ukuran smapel yang digunakan maka semakin baik hasil penelitian karena bisa mendekati keadaan populasi yang sebenarnya. Akan tetapi, mendapatkan ukuran sampel yang besar juga memerlukan waktu, tenaga dan biaya yang besar, oleh karena itu seringkali seorang peneliti hanya mampu mengadakan penelitian dengan ukuran sampel yang kecil. Hal ini kemudian menimbulkan permasalahan di mana hasil penelitian menjadi tidak bisa benar-benar merepresentasi populasi yang sebenarnya atau dengan kata lain akan terjadi bias. Salah satu solusi untuk mengatasi hal ini adalah melalui metode resampling. Resampling adalah suatu metode yang memungkinkan kita melakukan sampling dari data sampel, sehingga seolah-olah data hasil penelitian tersebut merupakan populasi. Terdapat dua metode resampling yang saat ini banyak digunakan yaitu dengan

menggunakan subset dari data yang tersedia (jackknifing) atau menggambar secara acak dengan penggantian dari satu set titik data ( bootstrapping ). Bootstrap dan jackknife umumnya bertujuan untuk menaksir salah baku dan selang kepercayaan parameter populasi, seperti mean, median, koefisien korelasi dan regresi, dengan tidak

memperhatikan asumsi distribusi. Metode bootstrap adalah metode resampling N data baru dari sampel asal berukuran n (N<n) di mana setiap kali sampling dilakukan pengembalian terhadap data asal. Banyaknya sampling yang dilakukan bisa mencapai ribuan kali. Sedangkan metode Jackknife adalah metode resampling n-1 data baru dari sampel asal berukuran n, yang mana setiap kali sampling dilakukan pengembalian. Banyaknya sampling yang dilakukan adalah n kali.

1.2. Permasalahan Permasalahan yang akan dibahas dalam makalah ini yaitu: Apa yang dimaksud dengan metode resampling bootstrap dan jackknife? Bagaimana prosedur metode resampling bootstrap dan jackknife? Bagaimana contoh penerapan metode bootstrap dan jackknife?

1.3. Tujuan Tujuan pembuatan makalah ini yaitu: Untuk mengetahui pengertian metode resampling bootstrap dan jackknife Untuk mengetahui prosedur metode resampling bootstrap dan jackknife Untuk mengetahui cara menerapkan metode bootstrap dan jackknife

BAB II TINJAUAN PUSTAKA

2.1. Metode Bootstrap Metode Bootstrap pertama kali diperkenalkan oleh Efron dan Tibshirani pada tahun 1979. Bootstrap berasal dari kata pull oneself up ones bootstrap yang berarti berpijak di atas kaki sendiri. Hal ini mengandung pengertian bahwa data yang berukuran kecil, data yang menyimpang dari asumsi-asumsi distribusi tertentu dan data yang tidak memiliki asumsi mengenai asumsi distribusi populasi (Efron dan Tibshirani, 1993). Metode bootstrap didasarkan pada prosedur resampling yaitu penarikan contoh acak secara berulang yang dilakukan dengan pengembalian. Metode ini memungkinkan peneliti untuk melakukan inferensi tanpa membuat anggapan atau asumsi mengenai distribusi populasi yang kuat dan tidak membutuhkan rumus analisitis untuk menduga distribusi sampel (Tinungki, 2000). Langkah-langkah dalam prosedur Bootstrap yaitu (): 1. Sampel asal, dari eksperimen atau simulasi, berukuran n. 2. Resample berukuran N (N<n) dengan pengembalian sehingga, didapatkan Resampel ke i (i = 1, 2, . . . , B). Hasil akan menjadi baik jika B>150 (Efron dan Tibshirani, 1993).

3. Perhitungan penaksir setiap hasil resample, didapatkan : b,1 ,b,2 ,...,b, B ; umumnya b,i
4. Perhitungan penaksir bootstrap -

bentuk

Rata-rata (Mean) bootstrap xb


xb 1 B xb,i B i 1

Ragam bootstrap s 2
s(2b ) 1 B ( xb,i xb )2 B 1 i 1

Selang kepercayaan Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang disebut selang persentil yaitu
xbr ;lower xbr ;upper

di mana:
xbr = penduga rata-rata bootstrap terurut

Lower = (/2)B Upper = (1-/2)B

2.2. Metode Jackknife Metode Jackknife pertama kalai diperkenalkan oleh Quenouille pada tahun 1949 dengan tujuan untuk mengurangi bias. Metode ini kemudian dikembangkan oleh Tukey pada tahuj 1958 sehingga terbentuk metode umum untuk memperkirakan ragam sebuah parameter. Tidak seperti metode Bootstrap yang mana banyaknya resample bisa mencapai ribuan, pada metode Jackknife resample dilakukan sebanyak n kali atau sama dengan ukuran contoh. Cara kerja metode Jackknife adalah sebagai berikut: 1. Sampel asal, berukuran n. 2. Resample berukuran n-1 dengan mengeluarkan pengamatan ke i, i = 1, 2, ... , n sehingga didapatkan Resample ke i (i = 1, 2, . . . , n).

5. Perhitungan penaksir setiap hasil resample, didapatkan : j ,1 , j ,2 ,..., j ,n ; umumnya j ,i


6. Perhitungan penaksir bootstrap -

bentuk

Rata-rata (Mean) jackknife x j


xj 1 n x j ,i n i 1

Ragam bootstrap s 2
s(2b ) n n ( xb,i xb )2 n 1 i 1

Selang kepercayaan Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang disebut selang persentil yaitu
x jr ;lower x jr ;upper

di mana:
x jr

= penduga rata-rata bootstrap terurut = (/2)n = (1-/2)n

Lower Upper

BAB III CONTOH SOAL DAN PEMBAHASAN

Berikut ini adalah data yang menunjukkan skor hasil efektivitas mahasiswa prodi Statistika angkatan 2009 kelas A dalam mengikuti mata kuliah Statistika Non Parametrik pada pagi hari dan siang hari : Responden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Pagi 16 17 14 14 16 16 16 16 17 18 16 15 16 10 15 17 16 12 16 16 15 12 16 16 12 14 14 14 18 18 17 siang 12 13 12 10 10 10 16 10 10 15 15 13 12 12 10 14 13 7 10 12 11 12 10 12 5 14 14 10 9 9 13

Dari data tersebut, dapat dicari selisih antara skor efektivitas pada siang hari dengan pagi hari sebagai berikut: Responden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Pagi 16 17 14 14 16 16 16 16 17 18 16 15 16 10 15 17 16 12 16 16 15 12 16 16 12 14 14 14 18 18 17 Siang 12 13 12 10 10 10 16 10 10 15 15 13 12 12 10 14 13 7 10 12 11 12 10 12 5 14 14 10 9 9 13 d -4 -4 -2 -4 -6 -6 0 -6 -7 -3 -1 -2 -4 2 -5 -3 -3 -5 -6 -4 -4 0 -6 -4 -7 0 0 -4 -9 -9 -4

Dengan menggunakan metode Bootstarp dan Jackknife akan dilakukan resampling untuk menduga apakah efektivitas mengikuti kuliah Statistika NonParamterik pada pagi dan siang hari adalah berbeda.

3.1 Metode Bootstrap Dengan menggunakan metode bootstrap akan dilakukan resampling dengan pengembalian dengan nb= 16 dan B=500 . Proses Penerapan Metode Bootstrap terhadap d dengan bantuan Ms. Excel 2007, langkahlangkahnya adalah sebagai berikut : 1. Input data d pada worksheet seperti gambar

2. Blok cells yang memuat original data sample d tersebut lalu definisikan Name sebagai Samples. 3. Lakukan pengacakan data sebanyak nb= 16 . Pada cell A10 isikan rumus: =INDEX(Samples;ROWS(Samples)*RAND()+1;COLUMNS(Samples)*RAND()+1) Lalu hold and drag sampai cell P10, sehingga diperoleh hasil seperti pada gambar berikut:

4. Blok range A10:P10, lalu hold drag hingga baris ke 509 supaya diperoleh pengulangan bootstrap sebanyak 500 5. Cari rata-rata dari masing-masing pengulangan dengan mengisikan rumus: =AVERAGE(A10:P10) di cell R10 untuk perulangan ke 1, sampai R509 untuk pengulangan ke 500. 6. Untuk mencari d.., isikan rumus: =AVERAGE(R10:R509) pada cell tertentu misal S10. Sedangkan untuk mencari Sd.., isikan rumus =STDEV(R10:R509) pada cell S10. lalu hold and drag

7. Apabila kita tertarik

untuk mencari interval konfidensi dari d.., maka lakukan

langkah berikut untuk sembarang cell.

8. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :

Pada kolom X : Isikan angka bin seperti pada cell X17 sampai X37 Pada kolom Y : isikan formula =FREQUENCY(R10:R509;X17:X37) Saat kursor masih berada di cell Y17, blok cell Y17:Y37, lalu tekan F2, lalu tekan Ctrl+Shift+Enter

Pada cell Y38 : isikan formula =SUM(Y17:Y37)

Pada kolom Z : isikan formula =SUM(Y17/Y$38) sampai Z37

lalu hold and drag

Data yang digunakan untuk membuat Chart adalah dari bin sebagai sumbu-X dan Probability sebagai sumbu-Y. Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih Two Average Moving Average). Sedangkan untuk menampilkan gambar fungsi kepekatan, pilih Chart dengan Scatter With Smooth Lines.

HASIL: Hipotesis: H0 : siang - pagi = 0 H0 : siang - pagi 0 atau H1 : d = 0 H1 : d 0

Dalam menerapkan metode bootstrap ini, resampling dilakukan terhadap d . dengan bantuan software MS. Excel 2007 diperoleh hasil sebagai berikut : = -2,93538

= 0,03158

Zhit =

Untuk nilai Z =

memiliki p-value = 0,0000

Karena p-value < , maka H0 ditolak Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.

Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi hari lebih efektif/baik daripada kuliah pada siang hari.

Selain itu dengan metode bootstrap ini, dapat pula dicari interval konfidensi untuk rata-rata d, yaitu P(-4,25 d -1,75) = 1-(2*0,05) P(-4,25 d -1,75) = 0,90 Karena d = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah berbeda.

Gambar 3.1. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan 500 pengulangan bootstrap

3.2 Metode Jackknife Dengan menggunakan metode jackknife akan dilakukan resampling dengan pengambilan dan pengembalian sebanyak n (n=31) Proses Penerapan Metode jackknife terhadap d dengan bantuan Ms. Excel 2007, langkahlangkahnya adalah sebagai berikut :

1. Input data d pada worksheet seperti gambar:

2. Resample dengan mengeluarkan elemen sampel ke i, i = 1, 2, ... , n. Didapatkan Resample ke i (i = 1, 2, . . . , n).

3. Perhitungan penaksir setiap hasil resample, didapatkan : nilai rata-rata dan nilai standar deviasi (akan didapatkan 31 nilai rata-rata dan nilai standar deviasi) 4. Kemudian hitung nilai rata-rata dari ke-31 nilai rata-rata yang telah diperoleh dan hitung nilai rata-rata dari ke-31 nilai standar deviasi yang telah diperoleh.

5. Apabila kita tertarik

untuk mencari interval konfidensi dari d.., maka lakukan

langkah berikut untuk sembarang cell.

6. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :

Pada kolom F : Isikan angka bin seperti pada cell F37 sampai F58 Pada kolom G : isikan formula =FREQUENCY(D34:AH34;F37:F58) Saat kursor masih berada di cell G37, blok cell G37:G58, lalu tekan F2, lalu tekan Ctrl+Shift+Enter

Pada cell Y38 : isikan formula =SUM(G37:G58) Pada kolom H : isikan formula =SUM(G37/G$59) sampai H58 lalu hold and drag

Data yang digunakan untuk membuat Chart adalah dari bin sebagai sumbu-X dan Probability sebagai sumbu-Y. Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih Two Average Moving Average). Sedangkan untuk menampilkan gambar fungsi kepekatan, pilih Chart dengan Scatter With Smooth Lines. HASIL: Hipotesis: H0 : siang - pagi = 0 H0 : siang - pagi 0 atau H1 : d = 0 H1 : d 0

Dalam menerapkan metode jackknife ini, resampling dilakukan terhadap d . dengan bantuan software MS. Excel 2007 diperoleh hasil sebagai berikut : = -3.87097

= 0.689

Zhit =

Untuk nilai Z =

memiliki p-value = 0.000

Karena p-value <, maka H0 ditolak. Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.

Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi hari lebih efektif/baik daripada kuliah pada siang hari. Selain itu dengan metode jackknife ini, dapat pula dicari interval konfidensi untuk rata-rata d, yaitu P(-4,06667 d -3,76667) = 1-(2*0,05) P(-4,06667 d -3,76667) = 0,90 Karena d = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah berbeda.

Gambar 3.2. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan metode jackknife

BAB IV PENUTUP

4.1. Kesimpulan Berdasarkan hasil analisis dan uraian yang telah dijabarkan, dapat disimpulkan beberapa hal sebagai berikut: Resampling adalah metode pengambilan contoh acak dari data hasil pengamatan Metode resampling yang banyak digunakan adalah Bootstrap dan Jackknife Metode Bootstrap adalah metode pengambilan contoh acak N dari contoh berukuran n dengan pengembalian sebanyak B kali Metode Jackknife adalah metode pengambilan contoh acak n-1 dari contoh berukuran n dengan pengembalian sebanyak n kali Untuk contoh soal yang ada, kedua metode resampling menghasilkan kesimpulan yang sama yaitu efektivitas mengikuti kuliah Statistika Non Parametrik pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.

4.2. Saran Saran yang dapat disampaikan yaitu apabila memungkinkan, maka sebaiknya peneliti menggunakan ukuran contoh yang besar. Namun, jika tidak maka disarankan untuk menggunakan metode resampling.

DAFTAR PUSTAKA

Anonymous. 2012. Resume Bootstrap dan Jackknife. http://oc.its.ac.id/ambilfile.php?idp=1150 diakses pada tanggal 20 Oktober 2012 Sahinler, S. dan Topuz, D. 2007. Bootstrap and Jackknife Resampling Algorithms for Estimation of Regression Parameter. Journal of Quantitative Method (2): 188-199 Tinungki, G. M. 2007. Skripsi: Perbandingan Ragam Penduga Regresi Linier Sederhana untuk Penarikan Contoh Dua Tahap dengan Metode Bootstrap. Metode Jackknife dan Metode Klasik. IPB : Bogor