Anda di halaman 1dari 11

TUGAS KOMPUTASI STATISTIKA

COMPUTER INTENSIVE STATISTICAL

Oleh 1. 2. . !. Viki A. Y. Dimas B. C. W. A"#$%%a& Ka'im S$si%( 101810101021 1018101010 ! 1018101010 8 1018101010!)

*URUSAN MATEMATIKA +AKULTAS MATEMATIKA DAN ILMU PENGETA,UAN ALAM UNIVERSITAS *EMBER 201

COMPUTER INTENSIVE STATISTICAL Prosedur resampling atau prosedur CIS dapat digunakan untuk memperkirakan signifikansi suatu statistik dalam uji hipotesis atau untuk menentukan batas bawah dan batas atas dari interval keyakinan ketika tidak dapat ditemukan dengan asumsi biasa dari prosedur statistik parametrik. Prosedur CIS memiliki lebih sedikit asumsi daripada statistik tradisional. Contohnya, untuk melakukan prosedur CIS tidak perlu diketahui distribusi data. Prosedur CIS digunakan untuk estimasi probabilitas, yaitu digunakan untuk menghitung nilai p dalam uji statistik atau menentukan batas bawah dan batas atas interval keyakinan tanpa bergantung pada asumsi statistika klasik seperti normalitas dan Teorema imit Tengah. Prosedur CIS dapat dibagi menjadi dua aliran yang unik dan terkait, yaitu metode pengacakan (randomisasi) dan metode Monte Carlo. 1. M-.(#- P-/0a1aka/ 2Ra/#(misasi3 !etode penga"akan, yang menggunakan resampling tanpa penggantian, menguji hipotesis nol bahwa dua variabel tidak berhubungan. #alam konteks ini, istilah penga"akan menga"u pada proses rekombinasi a"ak pada data simulasi a"ak, bukan sampling a"ak. !etode penga"akan bekerja dengan baik pada sampel a"ak atau tidak a"ak. $da dua metode penga"akan,yaitu uji permutasi dan uji pengacakan. a. U4i P-'m$.asi %ji permutasi adalah bentuk yang lengkap dari penga"akan. %ji permutasi juga dikenal sebagai uji penga"akan eksak. Pada uji permutasi, setiap kemungkinan kombinasi dari data yang ditarik didaftar &sebuah distribusi probabilitas eksak yang diperoleh' dan probabilitas data yang diberikan persis ditentukan oleh posisi persentil dari data yang diberikan pada daftar semua kemungkinan kombinasi. %ji permutasi dapat menjadi pengganti bagi uji parametrik atau nonparametrik lainnya. (amun, jumlah rekombinasi data yang begitu banyak dalam melakukan tes permutasi walaupun dengan data yang terke"il sekalipun, menjadikan uji permutasi tidak praktis se"ara komputasi.

". U4i P-/0a1aka/ %ji penga"akan menjadi pengganti bagi uji permutasi yang tidak praktis dan tidak mungkin dilakukan untuk data yang besar. )erikut langkah*langkah untuk melakukan uji penga"akan+ ,' #iberikan dua sampel &$, )' dengan masing*masing ,- angka. Tentukan mean dari grup $ dan grup ), dan selisih #- di antara kedua mean tersebut. .' Se"ara a"ak, alokasikan kembali ,- angka dari sampel ke grup $/ dan angka sisanya ke grup )/, lalu tentukan mean tiap*tiap grup dan selisih # , di antara mean tersebut. 0' %langi langkah &.' sebanyak N kali untuk mendapatkan nilai*nilai sampel dari distribusi # yang terjadi dengan mengalokasikan se"ara a"ak dua kelompok ,angka yang diamati. Perkiraan ini yang akan disebut sebagai 1distribusi penga"akan1. 2' 3ika #- terlihat seperti nilai khas dari distribusi penga"akan, simpulkan bahwa selisih angka antara $ dan ) terlihat a"ak, jika # - sangat besar maka dapat disimpulkan bahwa hipotesis alternatif lebih masuk akal. 2. M-.(#- M(/.- Ca'%( !etode !onte Carlo adalah algoritma komputasi untuk mensimulasikan berbagai perilaku sistem fisika dan matematika. Penggunaan klasik metode ini adalah untuk mengevaluasi integral definit, terutama integral multidimensi dengan syarat dan batasan yang rumit. Metode Monte Carlo sangat penting dalam fisika komputasi dan bidang terapan lainnya, dan memiliki aplikasi yang beragam mulai dari perhitungan kromodinamika kuantum esoterik hingga perancangan aerodinamika. Metode ini terbukti efisien dalam memecahkan persamaan diferensial integral medan radians, sehingga metode ini digunakan dalam perhitungan iluminasi global yang menghasilkan gambar-gambar fotorealistik model tiga dimensi, dimana diterapkan dalam video games, arsitektur, perancangan, film yang dihasilkan oleh komputer, efek-efek khusus dalam film, bisnis, ekonomi, dan bidang lainnya Karena algoritma ini memerlukan pengulangan (repetisi) dan perhitungan yang amat kompleks, metode Monte Carlo pada umumnya dilakukan menggunakan

komputer, dan memakai berbagai teknik simulasi komputer. !etode !onte Carlo sering digunakan untuk menunjukkan bagaimana nilai*nilai p untuk uji statistik atau metode estimasi berfungsi saat tidak ada data riil yang sesuai. Pada makalah ini, !etode !onte Carlo yang disajikan di sini adalah estimasi Monte Carlo, Bootstrap, Jackknife, dan estimasi Markov Chain Monte Carlo. a. Es.imasi M(/.- Ca'%( !etode estimasi !onte Carlo yang 4asli5 digunakan untuk menguji hipotesis bahwa data dari populasi tertentu merupakan sampel a"ak. melakukan prosedur !onte Carlo adalah+ ,' #iberikan sebuah sampel riil dari n pengamatan dari populasi yang ditetapkan. Identifikasi model populasi yang diambil sampelnya. .' )angkitkan sejumlah besar N simulasi sampel yang berukuran n dan hitung statistik yang dibutuhkan untuk setiap sampel. 0' %rutkan sampel simulasi yang dihitung se"ara statistik dalam distribusi, ini disebut distribusi !onte Carlo dari statistik. 2' Petakan statistik riil pada distribusi !onte Carlo6 gunakan "alon persentil pangkat dari statistik riil untuk memperkirakan p-value. Seperti dengan interval keyakinan pada penga"akan, interval keper"ayaan pada !onte Carlo tidak harus simetris. ". B((.s.'a5 )ootstrap merupakan teknik resampling lain yang mengasumsikan bahwa pengamatan independen dan melakukan sampling dengan penggantian dari populasi tak terbatas, di mana setiap pengamatan memiliki probabilitas yang sama untuk dipilih setiap saat. Statistik yang diinginkan dihitung dari sampel bootstrap ini dan seluruh prosedur ini diulang sampai k kali. 7al ini memastikan bahwa setiap sampel bootstrap bersifat independen. $lgoritma lengkap untuk prosedur bootstrap adalah sebagai berikut+ ,' #iketahui sebuah sampel berukuran n. Tarik sampel a"ak bootstrap yang berukuran n dengan penggantian &sekali ditarik, mungkin dapat ditarik kembali' dan hitung statistik bootstrap dari sampel ini. angkah*langkah untuk

.' %langi langkah &,' sebanyak N kali. 0' 8stimasi standar eror bootstrap dari parameter yang diinginkan menggunakan N statistik bootstrap sebagai masukan bagi persamaan standar eror biasa. Salah satu kelemahan dari bootstrap adalah semua metode untuk mengestimasi interval keyakinan bootstrap bergantung pada tingkat tertentu pada distribusi normal atau distribusi t. 1. *a1kk/i6Teknik ja"kknife banyak digunakan untuk mengukur bias dan standar eror dari estimasi. Prosedur untuk melakukan ja"kknife adalah+ ,' #iberikan sebuah sampel berukuran n dan estimasi sampel,
,

dari

parameter yang akan di"ari, . )agilah sampel menjadi g subsamples dengan ukuran h, sehingga gh 9 n. .' :eluarkan satu subsample dari seluruh sampel asli. 7itung sampel yang tersisa dengan ukuran sampel menjadi (g *,'h. 0'
/ g

dari

7itung 9 g ; &g ; ,'

1nilai

semu1

dari

dengan

bobot+

2' <'

%langi langkah . dan 0 untuk semua subsample g, sehingga menghasilkan sebuah ve"tor nilai semu g. $mbil rata*rata dari semua nilai semu ini untuk menghasilkan estimasi 3a"kknife dari . Seperti estimasi bootstrap, estimasi ja"kknife merupakan penyimpulan untuk

populasi yang paling spekulatif. (amun, estimasi ja"kknife gagal untuk statistik nonlinear yang riil seperti median, tidak seperti estimasi bootstrap. #. Es.imasi Ma'k(7 C&ai/ M(/.- Ca'%( 8stimasi !arkov Chain !onte Carlo atau !C!C menggabungkan metode !onte Carlo tradisional dengan inferensi )ayesian. Pada !C!C, diasumsikan prior distribusi sampling dari parameter populasi menjadi 1populasi1 yang sampel a"aknya ditarik pada prosedur !onte Carlo. )aik sampling maupun asumsi distribusi ini

diteruskan se"ara iterasi sampai estimasi parameter konvergen. Prosedur ini untuk memberikan informasi tentang superior yang tidak diketahui pada distribusi sampling dari populasi, tetapi distribusi prior diketahui.

. K-%-"i&a/ #a/ K-k$'a/0a/ CIS a. K-%-"i&a/


,'

!etode penga"akan+ uji se"ara seragam, asalkan N besar, bahkan ketika distribusi dari populasi tidak diketahui6. !etode penga"akan+ konsep dapat diakses. !C!C dan variasinya+ untuk penyelidikan kompleks, fenomena sosial bertingkat, terutama dengan 7!s6 memberikan kepada informasi deskriptif dan inferensial6 hebat untuk penggunaan dengan data yang hilang atau variabel laten.

.' 0'

2'

Semua metode+ !udah beradaptasi untuk bidang substantif pengguna.

". K-%-ma&a/8
,'

Semua metode+ kebanyakan prosedur dan variasi, beberapa mun"ul berbatasan dengan kepemilikan6 epidemi inkonsistensi istilah, simbol, dan jargon pada metode6 hampir banyak dan beragam program aplikasi ke bidang substantif6 menjadikan pengguna asing dengan konsep*konsep yang mendasari.

.'

)ootstrap+ Sensitif terhadap karakteristik sampel dan ukuran sampel6 bergantung pada keyakinan dalam distribusi populasi6 tidak menentu dalam estimasi dengan sampel tidak normal6 nilai p dan interval keyakinan masih tergantung pada asumsi distribusi normal atau distribusi t.

0'

3a"kknife+ Sebagian besar tidak relevan, terutama ketika prosedur bootstrap tersedia6 sama seperti kelemahan bootstrap. 8stimasi !onte Carlo+ Cenderung berlebihan6 dapat memberikan sedikit konsep dan komputasi sederhana tentang metode nonparametrik atau parametrik. !C!C dan variasinya+ konsep tidak dapat diakses oleh sebagian besar pengguna6 tidak relevan untuk mempelajari yang selain multilevel 7!s dan pertanyaan multidimensi lainnya.

2'

<'

!. C(/.(& P-/00$/aa/ M-.(#- M(/.- Ca'%(9 B((.s.'a59 #a/ *a1kk/i6a. M(/.- Ca'%( $/.$k P-/0i/.-0'a%a/

Simulasi di program =+ (>*,-?->*?,>*@ y->*y,>*< matrik>*matri?&-,(,.' for&i in ,+('A n>*<----/i ?>*runif&(,?-,?,' y>*runif&(,y-,y,' int>*fun"tion&?,y'A ?B./y C hasil>*int&?,y' nilai>*&?,*?-'/&y,*y-'/mean&hasil' matrikDi,,E>*n matrikDi,.E>*nilai C print&summary&matrikD,.E'' plot&matrikD,,E,matrikD,.E,type9FbF'

". B((.s.'a5 $/.$k Es.imasi M-a/ #iketahui G sampel data nilai matematika siswa S!$', H-, I<, @0, I@, G-, H., H2, @I, G0. 8stimasi mean tinggi badan mahasiswa menggunakan bootstrap. Program =+ ?>*"&H-, I<, @0, I@, G-, H., H2, @I, G0' (>*,---siswa>*matri?&-,(,,' for &i in ,+('A y>*sample&?,G,repla"e9T=%8' siswaDiE>*mean&y' C print&summary&y'' plot&siswaD,,E,type9FlF, ?lab9F(F,ylab9F!eanF'

3adi, rata*rata nilai matematika siswa tersebut adalah @G,@H. 1. *a1kk/i6- $/.$k K-%a/4$.a/ B((.s.'a5 ?>*"&H-, I<, @0, I@, G-, H., H2, @I, G0' (>*,-siswa>*matri?&-,(,.' J=esampling for&i in ,+('A siswaDiE>*mean&sample&?,repla"e9T=%8'' C print&summary&siswaD,,E'' J3a"kknife ja"k>*siswaD,,E for&i in ,+('A siswaDi,.E>*mean&ja"kD*iE' C print&summary&siswaD,.E''

par&mfrow9"&.,.'' plot&siswaD,,E,type9FlF,main9FPlot =esamplingF,?lab9F(F,ylab9FmeanF' hist&siswaD,,E,main9F7istogram =esamplingF,?lab9FmeanF,ylab9FfrekuensiF' plot&siswaD,.E,type9FlF,main9FPlot 3a"kknife dari )ootstrapF,?lab9F(F,ylab9FmeanF' hist&siswaD,.E,main9F7istogram 3a"kknife dari )ootstrapF,?lab9FmeanF,ylab9FfrekuensiF'