Nurul Kustinah M0106057

perpustakaan.uns.ac.id digilib.uns.ac.
id
PEMILIHAN MODEL REGRESI TERBAIK DENGAN

BAYESIAN INFORMATION CRITERION (BIC)
oleh
NURUL KUSTINAH
M0106057
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan
memperoleh gelar Sarjana Sains Matematika
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET SURAKARTA
2012
commit to user
perpustakaan.uns.ac.id digilib.uns.ac.id
SKRIPSI
PEMILIHAN MODEL REGRESI TERBAIK DENGAN
BAYESIAN INFORMATION CRITERION (BIC)
yang disiapkan dan disusun oleh

NURUL KUSTINAH
M0106057
dibimbing oleh
Pembimbing I Pembimbing II
Dra. Yuliana Susanti, M.Si Bowo Winarno, S.Si, M.Kom

NIP. 19611219 198703 2 001 NIP. 19810430 200812 1 001
telah dipertahankan di depan Dewan Penguji
pada hari Senin, 2 Januari 2012
dan dinyatakan telah memenuhi syarat.
Anggota Tim Penguji Tanda Tangan

1. Dra. Respatiwulan, M.Si 1.
NIP. 19680611 199302 2 001
2. Drs. Siswanto, M.Si 2.
NIP. 19670813 199203 1 002
Surakarta, 2 Januari 2012
Disahkan oleh
Fakultas Matematika dan Ilmu Pengetahuan Alam
Dekan Ketua Jurusan Matematika
Ir. Ari Handono Ramelan, MSc., PhD Irwan Susanto, DEA

NIP. 19610223 198601 1 001 NIP. 19710511 199512 1 001
commit to user
ii
ABSTRAK
Nurul Kustinah, 2011. PEMILIHAN MODEL REGRESI TERBAIK

DENGAN BAYESIAN INFORMATION CRITERION (BIC). Fakultas
Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas Maret.
Pemilihan model regresi linear terbaik adalah memilih model regresi linear
yang memiliki kecocokan dengan data. Terdapat beberapa kriteria sebagai tolak
ukur untuk menilai suatu kecocokan model dengan data, salah satu satunya
adalah BIC.
BIC merupakan metode pemilihan model terbaik dari beberapa kandidat
model. Kriteria pemilihan model dengan menggunakan BIC didasarkan pada
teorema Bayesian dan metode MLE. Tujuan dari penelitian ini adalah mengkaji
ulang metode BIC dan menerapkannya dalam pemilihan model regresi terbaik.
Berdasarkan hasil penelitian menunjukkan bahwa BIC memiliki bentuk umum
yaitu
| = −2ln + ln .
Dalam memilih model regresi terbaik dengan BIC dilakukan dengan memilih
model dengan nilai BIC terkecil yang didapat dari
"
= ln2 + ln ! + $# ln + 1.
Kata kunci: regresi linear, teorema Bayesian, MLE, BIC.
commit to user
iii
ABSTRACT
Nurul Kustinah, 2011. THE BEST SELECTION REGRESSION MODEL

WITH BAYESIAN INFORMATION CRITERION (BIC). Faculty of
Mathematics and Natural Sciences. Sebelas Maret University.
The best regression model selection is method for selection the most
appropriate fit between the regression model and the data. There are several
criterias as a benchmark to evaluate the suitability of the model with data, one of
them is BIC.
BIC is a method in model selection to choose the best of several candidate
models. Criteria for model selection using BIC is based on Bayesian theorem and
MLE. The aims of this research are to review the BIC and apply it in the best
regression model selection. Based on the results, BIC has the general form
| = −2ln + ln .
In selecting the best regression model with BIC performed by selecting the model
with the smallest BIC value obtained from
"
= ln2 + ln ! + # ln + 1.
$
Keywords: linear regression, Bayesian theorem, MLE, BIC.
commit to user
iv
MOTO
“Sesungguhnya sesudah kesulitan itu ada kemudahan.”

(QS. Alam Nasyrah: 6)
“Dan Dia mendapatimu sebagai seorang yang bingung,

lalu Dia beri petunjuk.”
(QS: Ad-Duhaa ayat 7)
“Jangan pernah menghindar dan selalu berkata tidak, majulah ke depan, hadapi
hidupmu dan berkatalah, ya, aku bisa!”
commit to user
v
PERSEMBAHAN
Alhamdulillahirobbil ‘aalamiin...
Karya ini kupersembahkan untuk
Ibu dan Bapak tercinta
Yang tiada henti mendoakan aku
Kakakku Mas Rochim dan mbak Ita
Adikku Tirta dan Riyanti
Kak Gilang dan keluarga atas semua fasilitasnya
Valui Aditya dengan bantuan laptopnya
Damar, Bili, Uswa, Desi, Umi, Siti & Ahmad yang memberi semangat
commit to user
vi
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas segala
rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini. Selain
itu, penulis mengucapkan terima kasih kepada seluruh pihak yang telah membantu
dalam penyusunan skripsi ini.
1. Dra. Yuliana Susanti, M.Si dan Bowo Winarno, S.Si, M.Kom selaku Dosen
Pembimbing I dan Dosen Pembimbing II yang telah memberikan bimbingan
kepada penulis.
2. Endah Krisna Murti yang telah memberi bantuan diskusi materi kepada
penulis.
3. Semua pihak yang telah membantu sehingga skripsi ini dapat selesai.
Semoga skripsi ini bermanfaat untuk semua pihak.
Surakarta, 2 Januari 2012
Penulis
commit to user
vii
DAFTAR ISI
Halaman
JUDUL ..................................................................................................... i
PENGESAHAN ....................................................................................... ii
ABSTRAK ............................................................................................. iii
ABSTRACT ............................................................................................. iv
MOTO ..................................................................................................... v
PERSEMBAHAN ................................................................................. vi
KATA PENGANTAR ........................................................................... vii
DAFTAR ISI .......................................................................................... viii
DAFTAR GAMBAR .............................................................................. ix
DAFTAR TABEL ................................................................................. xi
BAB I PENDAHULUAN ..................................................................... 1
1.1 Latar Belakang Masalah ................................................................ 1
1.2 Rumusan Masalah ..................................................................... 2
1.3 Tujuan Penelitian ..................................................................... 2
1.4 Manfaat Penelitian ..................................................................... 2
BAB II LANDASAN TEORI .................................................................. 3
2.1 Tinjauan Pustaka ..................................................................... 3
2.1.1 Probabilitas Bersyarat .................................................... 3
2.1.2 Estimasi Maksimum Likelihood ...................................... 4
2.1.3 Distribusi Prior dan Distribusi Posterior ........................ 5
2.1.4 Teorema Bayes ................................................................ 6
2.1.5 Faktor Bayes ..................................................................... 7
2.1.6 Uji Asumsi Klasik .............................................................. 8
2.1.7 Analisis Model Regresi .................................................... 11
2.2 Kerangka Pemikiran ..................................................................... 12
BAB III METODE PENELITIAN .......................................................... 13
BAB IV PEMBAHASAN ...................................................................... 14
4.1 Bayesian information criterion(BIC) ............................................... 14
commit to user
viii
4.2 BIC dalam Regresi ...................................................................... 17

4.3 Contoh Aplikasi pemilihan Model Regresi Terbaik dengan BIC........ 19
BAB V PENUTUP .................................................................................. 26
5.1 Kesimpulan ................................................................................... 26
5.2 Saran ............................................................................................... 26
DAFTAR PUSTAKA ............................................................................... 27
LAMPIRAN
commit to user
ix
DAFTAR GAMBAR
Halaman
Gambar 2.1 Pola plot residu terhadap & .................................................. 9
Gambar 4.1 Plot probabilitas dari residu ...........................................….. 20
Gambar 4.2 Plot residu dengan & .............................................……….. 21
commit to user
x
DAFTAR TABEL
Halaman
Tabel 4.1 Hasil Uji Multikolinearitas …………............…………….… 21
Tabel 4.2 Hasil Uji F .............................................................................. 23
Tabel 4.3 Hasil Uji t ................................................................................ 24
Tabel 4.4 Nilai BIC dari model ............................................................... 24
commit to user
xi
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah

Analisis regresi adalah teknik statistik yang digunakan untuk menyelidiki
dan memodelkan hubungan antara variabel-variabel yang terdiri dari variabel
independen dan variabel dependen. Model regresi adalah suatu cara untuk
mengetahui kecenderungan perubahan variabel dependen Y yang berubah sesuai
perubahan variabel independen X. Model regresi dapat digunakan untuk beberapa
tujuan antara lain untuk deskripsi data, estimasi dan prediksi. Penerapan dari
regresi sangat banyak dan dapat ditemukan hampir disetiap bidang ilmu
pengetahuan. Penerapan regresi diantaranya dapat ditemukan dalam analisis
runtun waktu, ilmu ekonomi, biologi, dan ilmu sosial (Sembiring,1995).
Pada analisis regresi hubungan antara variabel dependen (Y) dan beberapa
variabel independen (X) dapat dinyatakan dengan suatu model regresi linear yaitu
ܻ = ߚ଴ + ߚଵ ܺଵ + ⋯ + ߚ௣ ܺ௣ + ߝ, dengan ‫ ݌‬adalah banyaknya variabel independen, ߚ
adalah parameter dan ߝ௜ adalah sesatan random dengan asumsi ߝ௜ ~ ݅݅݀ ܰ(0; ߪ ଶ ),
untuk ݅ = 1,2, … , ݊ (Neter dan Wasserman, 1996).
Ada beberapa metode pemilihan model regresi terbaik, diantaranya adalah
metode Akaike’s Information Criterion (AIC) dan Bayesian Information Criterion
(BIC). BIC merupakan salah satu kriteria pemilihan model terbaik dimana konsep
dari metode ini dikemukakan oleh Schwarz (1978). Perumusan BIC menggunakan
teorema Bayesian untuk menentukan probabilitas posterior. Estimasi parameter
dalam model regresi menggunakan MLE. Kemudian BIC digunakan untuk
pemilihan model regresi. Hasil pemilihan model dengan BIC cukup akurat karena
jumlah parameter dalam model diperhatikan. Dalam penelitian ini, penulis
mengkaji ulang metode BIC dan menerapkannya dalam regresi linear.
commit to user
1
2
1.2 Perumusan Masalah

Berdasarkan uraian dalam latar belakang masalah, dapat dirumuskan
permasalahan yaitu bagaimana menurunkan ulang metode BIC dan penerapan BIC
dalam pemilihan model regresi terbaik.
1.3 Tujuan Penelitian

Tujuan yang ingin dicapai adalah menjelaskan metode BIC dan
menerapkan BIC dalam regresi linear.
1.4 Manfaat Penelitian

Memberikan pemahaman yang lebih tentang BIC untuk pemilihan model
regresi terbaik dan sebagai bahan referensi penelitian yang akan datang.
commit to user
BAB II
LANDASAN TEORI
2.1 Tinjauan Pustaka

Pada bagian pertama dari bab ini diberikan tinjauan pustaka yang terdiri
dari definisi maupun teorema sebagai dasar pengertian untuk mempermudah
pembahasan selanjutnya. Pada bagian kedua dari bab ini disusun kerangka
pemikiran yang menjelaskan alur dalam penulisan skripsi ini. Berikut ini akan
diberikan beberapa definisi dan pengertian yang mendukung pemilihan model
regresi terbaik berdasarkan metode BIC.
2.1.1 Probabilitas bersyarat

Pengertian tentang probabilitas bersyarat peristiwa A jika diketahui B telah
terjadi ditulis sebagai | pada dua kejadian independen dan fungsi likelihood
diberikan pada definisi dan teorema berikut menurut Bain dan Engelhardt(1992).
Definisi 2.1. Diberikan suatu percobaan dengan S sebagai ruang sampel dan
A1, A2, A3,… ,An merupakan kejadian asing yang mungkin terjadi. Sebuah fungsi
yang mengawankan nilai real dari P(A) dengan setiap kejadian A disebut
probabilitas dari A, dinotasikan P(A), jika memenuhi :
1. ≥ 0 untuk setiap himpunan bagian
2. P (S) = 1
= ∑ .
3. ⋃
Probabilitas terjadinya suatu peristiwa A, bila diketahui peristiwa B telah terjadi

disebut probabilitas bersyarat dan dinotasikan |.
Definisi 2.2 S suatu ruang sampel dan A, B adalah peristiwa-peristiwa di dalam

S. Probabilitas bersyarat P(A|B) didefinisikan sebagai
∩
| =
.
commit to user
3
4
Definisi 2.3. S adalah suatu ruang sampel dari suatu percobaan. A1 , A2, ... , Ak
adalah peristiwa-peristiwa di dalam S, sedemikian hingga ∩ = ∅ untuk
setiap ≠ dan ⋃
=
.
Dikatakan bahwa A1 , A2, ... , Ak membentuk partisi dalam S.
Teorema 2.1. (Teorema Probabilitas Total). Jika A=[ A1 , A2, ... , Ak] adalah
partisi S dan B sebarang peristiwa anggota S, maka
P(B)=P(B|A1)P(A1)+P(B|A2)P(A2)+ ... +P(B|Ak)P(Ak).
2.1.2 Estimasi Maksimum Likelihood

Pengertian tentang estimasi maksimum likelihood yang diberikan pada
definisi berikut menurut Bain dan Engelhardt(1992).
Definisi 2.4. Fungsi kepadatan bersama dari n variabel random , , … ,
pada , , … , dilambangkan dengan ! , , … , ; # dengan # $ % dimana
% adalah ruang parameter yang tidak diketahui dinyatakan dengan fungsi
likelihood. Untuk , , … , yang tetap fungsi likelihood adalah fungsi dari #
dan dinotasikan &#. Jika , , … , mewakili sampel random dari ! , #
maka,
&# = ∏ ! ; # = ! ; #! ; # … ! ; #.
Definisi 2.5. Misalkan &# = ! , , … , ; # dengan # $ %, adalah fungsi

kepadatan bersama dari variabel random , … , . Untuk himpunan
pengamatan , , … , , suatu nilai #( dalam % yang memaksimumkan &#
disebut sebagai estimator maksimum likelihood dari #. Secara sistematis ditulis,
!) , ( =
, … , ; #* +,-! , , … , ; #.
./0
Memaksimumkan log &# lebih mudah dibandingkan memaksimumkan

&# sehingga dapat ditulis sebagai,
log !) , ( =
, … , ; #* +,-! , , … , ; #.
./0
commit to user
5
Apabila Ω adalah interval terbuka dari L(# yang differensiabel dan

diasumsikan maksimum pada Ω, maka estimator maksimum likelihood dari #
diperoleh dengan menyelesaikan persamaan
23456+
= 0.
2+
Jika terdapat lebih dari satu penyelesaian untuk # maka dicari
penyelesaian yang memaksimumkan L(# dengan membandingkan penyelesaian
untuk # yang telah diperoleh. Kemudian dicari turunan kedua dari L(#. Bila
nilainya negatif maka penyelesaian untuk # tersebut merupakan estimator
maksimum.
Kegunaan MLE dalam mendapatkan estimator parameter dari suatu
distribusi dapat digunakan untuk menyusun suatu matriks yang disebut matriks
informasi Fisher. Invers dari matriks ini disebut matriks invarian-kovarian. Untuk
menentukan variansi dan kovariansi yang asimtotik dari estimator maka
dikonstruksikan sebuah matriks informasi I dengan elemen ke-8 adalah :
< log&#;
I9 = : ; @
<# #9
Invers matriks, IA adalah matriks varian-kovarian dari #(. Var )#( * = I
dan cov )#( , #9 * = I9 .
2.1.3 Distribusi Prior dan Distribusi Posterior

Definisi distribusi prior dan distribusi posterior di bawah ini menurut
Larson (1974).
Deinisi 2.6. Distribusi prior dari suatu parameter # merupakan fungsi kepadatan
probabilitas yang menggambarkan tingkat keyakinan nilai #.
Sebagaimana ditulis oleh Larson, distribusi prior tersebut diperoleh sebelum
melakukan analisis data.
Definisi 2.7. Fungsi kepadatan posterior untuk # merupakan fungsi kepadatan

probabilitas bersyarat # diberikan nilai sampel y, sehingga
commit to user
6
CD,+
!#|B = .
CD
Secara umum, distribusi posterior menggambarkan tingkat keyakinan terhadap

kemungkinan nilai parameter # setelah diberikan nilai sampel.
2.1.4 Teorema Bayes

Percobaan awal yang telah dilakukan akan berpengaruh terhadap hasil
percobaan sekarang. Untuk menghitung probabilitas kejadian sekarang dengan
syarat kejadian awal dijelaskan dalam teorema Bayes. Teorema 2.2 di bawah ini
diambil dari Bain dan Engelhardt (1992), sedangkan teorema 2.3 dan teorema 2.4
diambil dari Walpole dan Myers (1995).
Teorema 2.2. Jika A dan B adalah dua kejadian sebarang, maka
∪ = + − ∩ .
Akibatnya jika A dan B adalah kejadian yang saling asing, maka ∩ = ∅
sehingga ∪ = + . Selanjutnya jika , , … , saling asing,
maka ∪ ∪ … ∪ = + + ⋯ + .
Teorema 2.3. Misal kejadian , , … , merupakan kejadian yang saling asing
dari ruang sampel S dengan ≠ 0 untuk = 1,2, … , . Maka untuk setiap
kejadian A anggota S,
= ∑ ∩ = ∑ | .
Teorema 2.4. Misal kejadian , , … , merupakan kejadian yang saling asing
dari ruang sampel S dengan ≠ 0 untuk = 1,2, … , . Misalkan A suatu
kejadian sebarang dalam S dengan ≠ 0, maka
L ∩ L |L
K | = ∑N = ∑N , untuk Q = 1,2, … , .
MOP M ∩ MOP M |M
Teorema 2.4 disebut sebagai teorema Bayes. Teorema Bayes memberikan aturan
untuk menghitung probabilitas bersyarat peristiwa K diberikan A, jika masing-
masing probabilitas tak bersyarat K dan probabilitas bersyarat A yang diberikan
K diketahui. Untuk selanjutnya, K disebut probabilitas prior, |K
disebut sebagai fungsi likelihood dan K | disebut fungsi probabilitas
posterior.
commit to user
7
2.1.5 Faktor Bayes

Dari sampel random = { , , … , } diberikan T model, yaitu :
{U , U , … , UV }. Misalkan bahwa ! ( |# ) adalah fungsi kepadatan U dari data
dan W# merupakan fungsi kepadatan priornya, dimana parameter # tidak
diketahui serta # $Θ , untuk i=1, 2, ... , T.
Jika distribusi prior dari model-model tersebut adalah # , # , … , #V
maka distribusi posteriornya adalah
# Z
U | =
∑ # Z
V

dengan
Z = [ ! |# W # \# .
Z adalah distribusi marginal dari data sampel pada model U .
Jadi rasio probabilitas posterior untuk 2 model U9 dan U adalah
)#9 *Z9
∑ )#9 *Z9
V

)U9 ] * =
# Z
∑V )#9 *Z9
)#8 *Z8
=
# Z
)#9 *
=
^# 9
dengan 9 adalah faktor Bayes untuk model U9 dan U dari data sampel ,
ditulis
._ 0
9 =
.N 0
.
Faktor Bayes sangatlah berhubungan dengan distribusi prior, hal ini

dikarenakan faktor Bayes didefinisikan dengan rasio dari distribusi marginal yang
bergantung pada nilai-nilai absolut dari prior-prior W (Kass and Raftery, 1995).
commit to user
8
2.1.6 Uji Asumsi Klasik

2.1.6.1 Normalitas
Gujarati (1995) menjelaskan bahwa pada regresi linear klasik diasumsikan
bahwa tiap ` didistribusikan secara normal dengan ` ~b0, c .
Salah satu cara untuk menguji asumsi kenormalan adalah dengan uji
Kolmogorov-Smirnov.
Pengujian hipotesis yang digunakan adalah sebagai berikut :
a. de : Data berdistribusi normal
d ∶ Data tidak berdistribusi normal
b. Tingkat signifikasi h
c. Daerah kritis: de ditolak jika ijklm > ik/opV
d. Statistik uji
ijklm = Zq |re −
|, = 1,2, … , s.
dengan,
re : fungsi distribusi frekuensi kumulatif relatif dari distribusi teoritis di
bawah de .

: distribusi frekuensi kumulatif pengamatan sebanyak sampel.
e. Kesimpulan : Jika de ditolak maka data tidak berdistribusi normal.
2.1.6.2 Heteroskedastisitas
Uji heterokedastisitas bertujuan untuk mengetahui apakah variansi `
konstan. Pendeteksian kesamaan variansi dapat dilakukan dengan membuat plot
sisa terhadap t( . Plot yang diperoleh seharusnya tidak menghasilkan pola tertentu
dan terkumpul di sekitar garis lurus yang melalui titik nol.
Montgomery dan Peck (1992) menggambarkan beberapa plot sisa terhadap

t( sebagai berikut
commit to user
9
` `
t( t(
(a) (b)
i
` `
t( t(
(c) (d)
Gambar 2.1 Pola plot residu terhadap t(
Jika hasil plot mirip pola pada Gambar 2.1a maka berarti asumsi
homogenitas variansi dipenuhi karena titik tersebar. Pada Gambar 2.1b
menunjukkan bahwa titik tersebar dengan variansi tidak konstan
(heteroskedastisitas). Pola pada Gambar 2.1c seharusnya tidak akan muncul
kecuali kalau ada kesalahan dalam perhitungan. Pola Gambar 2.1d menunjukkan
model yang digunakan kurang tepat, atau perlu dilakukan transformasi.
2.1.6.3 Mutikolinearitas
Menurut Montgomery dan Peck (1992), salah satu cara mendeteksi adanya
multikolinearitas dalam model adalah dengan nilai tolerance dan VIF (Variance
Inflation Factors). Matriks u = ′ A adalah matriks untuk mendeteksi adanya
multikolinearitas dengan u99 merupakan diagonal matriks u yang dapat ditulis
1
vwr9 = u99 =
1 − x9
commit to user
10
dengan x9 adalah nilai koefisien determinasi atau x ketika yang diregresikan
dengan variabel bebas selain . vwr9 adalah faktor perubahan variansi dalam
variabel bebas ke-j. Nilai vwr > 10 menunjukkan multikolinearitas yang kuat.
2.1.6.4 Autokorelasi
Autokorelasi adalah suatu keadaan kesalahan gangguan dari periode
tertentu berkorelasi dengan kesalahan gangguan dari periode sebelumnya. Jika
kesalahan gangguan periode y dengan y − 1 berkorelasi maka terjadi korelasi
tingkat pertama. Autokorelasi dapat dideteksi dengan berbagai cara antara lain
dengan uji Durbin Watson. Langkah-langkah pengujian autokorelasi dengan
Durbin Watson adalah sebagai berikut (Gujarati, 1995):
1. Melakukan regresi kuadrat terkecil biasa dan memperoleh residu
2. Menghitung nilai \ (statistik Durbin Watson ), dengan
∑k$k − $kA
\=
∑k $k
3. Mencari nilai \6 (batas bawah Durbin Watson) dan \z (batas atas Durbin
Watson) untuk ukuran sampel dan banyaknya variabel independen tertentu.
4. Jika de adalah tidak terdapat autokorelasi positif, maka jika
\ < \6 : menolak de
\ > \z : tidak menolak de
\6 ≤ \ ≤ \z : pengujian tidak meyakinkan
5. Jika de adalah tidak terdapat autokorelasi negatif, maka jika
\ > 4 − \6 : menolak de
\ < 4 − \z : tidak menolak de
4 − \z ≤ \ ≤ 4 − \6 : pengujian tidak meyakinkan
6. Jika de adalah tidak terdapat autokorelasi positif atau negatif, maka jika
\ < \6 : menolak de
\ > 4 − \6 : menolak de
\z < \ < 4 − \z : tidak menolak de
\6 ≤ \ ≤ \z : pengujian tidak meyakinkan
4 − \z ≤ \ ≤ 4 − \6 : pengujian tidak meyakinkan
commit to user
11
2.1.7 Analisis Model Regresi

2.1.7.1 Uji Serempak (Uji F)
Menurut Supranto (1995) uji serempak dilakukan untuk mengetahui
apakah variabel independen berpengaruh secara bersama-sama terhadap variabel
dependen. Sebelum pengujian hipotesis akan dicari perumusan rjklm terlebih
dahulu
x/^ − 1 xx
rjklm = =

/s − ^ x
dengan,
xx: Rataan Kuadrat Regresi
x
: Rataan Kuadrat Sisa
a. de : = = ⋯ = = 0 (variabel independen secara bersama-sama tidak
mempunyai pengaruh yang signifikan terhadap variabel dependen)
d ∶ 9 ≠ 0, untuk 8 = 1, 2, … , (variabel independen secara bersama-sama
mempunyai pengaruh yang signifikan terhadap variabel dependen)
c. Daerah kritis: de ditolak jikarjklm > r,A,A
d. Statistik uji
xx
rjklm =
x
e. Kesimpulan : Jika de ditolak maka variabel independen secara bersama-sama

mempunyai pengaruh yang signifikan terhadap variabel dependen.
2.1.7.2 Uji Parsial (Uji t)

Menurut Supranto (1995) uji parsial dilakukan untuk mengetahui pengaruh
variabel independen secara individual terhadap variabel dependen, dengan
menganggap variabel independen lainnya konstan.
a. de : 9 = 0, untuk 8 = 1, 2, … , (tidak ada pengaruh yang signifikan antara
variabel independen ke-j terhadap variabel dependen)
commit to user
12
d ∶ 9 ≠ 0, untuk 8 = 1, 2, … , (ada pengaruh yang signifikan antara variabel

indenpenden ke-j terhadap variabel dependen)
c. Daerah kritis, de ditolak jika yjklm > y/,A atau −yjklm < y/,A
d. Statistik uji
9
yjklm =

:9
dengan,
9 = koefisien regresi independen 9

:)9 * = sesatan standar dari koefisien regrsi 9 .
e. Kesimpulan : Jika de ditolak maka ada pengaruh yang signifikan antara
variabel independen ke-j terhadap variabel dependen.
2.2 Kerangka Pemikiran

BIC merupakan suatu metode pemilihan model dengan menerapkan
beberapa teorema Bayesian dan MLE dalam penurunan rumusnya. Selanjutnya
hasil penurunan rumus yang diperoleh diterapkan dalam regresi linear. Rumus
yang diperoleh untuk regresi diterapkan untuk menentukan model terbaik pada
suatu data. Data diregresikan dengan regresi linear kemudian sesatan model diuji
dengan asumsi klasik regresi linear yaitu normalitas, tidak terdapat
multikolinearitas, tidak terdapat heteroskedastisitas dan tidak terdapat
autokorelasi. Kemudian model dipilih sebagai model terbaik menurut metode BIC.
commit to user
BAB III
METODE PENELITIAN
Pada penelitian ini, metode yang digunakan adalah studi literatur dan
penerapan kasus, dengan pengumpulan bahan melalui buku-buku referensi dan
karya ilmiah yang meliputi hasil-hasil penelitian dan jurnal. Adapun langkah
penelitian sebagai berikut.
1. Menurunkan rumus Bayesian Information Criterion (BIC) sehingga diperoleh
bentuk umum BIC.
2. Menentukan rumus BIC berdasarkan bentuk umum yang diperoleh pada
langkah nomor 1 untuk memilih model regresi terbaik.
3. Menentukan data yang digunakan kemudian uji residu data dengan uji asumsi
klasik regresi linear
4. Pilih model regresi terbaik dengan metode BIC, dimana nilai BIC dihitung
dengan cara
a. Hitung nilai ߪෝ ଶ dari masing-masing kombinasi model
௣ೖ
b. Hitung nilai
௡
ln ݊ dari masing-masing kombinasi model
c. Hitung nilai ln2ߨ

d. Hitung nilai BIC dari masing-masing kombinasi model yang diperoleh dari
௣ೖ
‫ܥܫܤ‬௥௘௚௥௘௦௜ = ln2ߨ + lnߪෝ ଶ + ௡
ln ݊ + 1
e. Pilih model dengan nilai BIC terkecil sebagai model terbaik
commit to user
13
BAB IV
PEMBAHASAN
BIC merupakan metode pemilihan model terbaik dari beberapa kandidat

model. Konsep BIC pertama kali diperkenalkan oleh Schwarz (1978), BIC yang
dikembangkan oleh Schwarz ini menggunakan beberapa teorema Bayesian,
sehingga BIC dikenal juga dengan Schwarz’s Bayesian Information Criterion
(SBIC) dan ada juga yang menyebutnya dengan Schwarz Bayesian Criterion
(SBC). Metode pemilihan model dengan menggunakan BIC didasarkan pada
metode MLE dan teorema Bayesian. Dalam memilih model terbaik dengan
metode BIC dipilih model dengan nilai BIC terkecil. Semakin kecil nilai BIC
semakin baik modelnya. Hal ini dikarenakan dengan meningkatnya akan
meningkatkan nilai BIC. Oleh karena itu, dipilih nilai BIC terkecil (Fathurahman,
2009).
4.1 Bayesian Information Criterion (BIC)
BIC adalah metode pemilihan model dari beberapa kandidat model.

Bentuk umum BIC dicari untuk n data sampel = , , … , , berdasarkan
data sampel tersebut akan dipilih suatu model terbaik dari l model yang mungkin
yaitu , , … , , dimana ∈ , , … , dan ∈ 1,2, … , . Model
digambarkan dengan probabilitas | , dimana Θ adalah vektor
parameter dari dan | merupakan fungsi likelihoodnya dengan
adalah estimasi maksimum likelihood dari parameter . Misalkan adalah
prior diskrit pada model , , … , dan | adalah prior untuk parameter
dari model .
Dengan menerapkan teorema Bayes, joint posterior dari dan dapat
ditulis menjadi :
| |
, | =

commit to user
14
15
dimana merupakan distribusi marginal dari .
Berdasarkan data sampel, probabilitas posterior model dapat ditulis
" # $%& |'( %& |)%&

!| = *'
(4.1).
Dalam pemilihan model dengan aturan Bayes, akan memilih model

yang memberikan probabilitas posterior terbesar. Meminimumkan nilai
−2ln.!|/ sebagai lawan memaksimumkan !|. Sehingga diperoleh
−2ln.!|/ = 2ln. / − 2ln./ − 2ln0#3 |g |2 4.
∞
Karena nilai suatu konstanta tetap untuk model , maka untuk tujuan
model seleksi bentuk 25 dapat disederhanakan, sehingga diperoleh
−2ln!|)∝ −2ln()−2ln0#3 | g |2 4 = 7 |

∞
(4.2).
Pada bentuk #3 L | g |2 , dengan mengambil ekspansi deret taylor
∞
orde ke-2 dari log Likelihood di sekitar , bentuk ln | dapat ditulis
:/
′ <ln. 1 ′ < ln.
:/
ln | ≈ ln. :/ + . − / + . − / . − /
< 2 < < ′
= ln. :/ − . − / [5Ι> , ] . − /

′
(4.3)
dengan
E
Ι>. , / = − @% @%′& .
@ BCD.% :'/ A
& &
Ι>. , / merupakan rata-rata pengamatan matriks informasi Fisher.

Dengan mengubah bentuk persamaan (4.3) ke dalam bentuk anti ln menjadi
| ≈ L. :/exp − . − / [5Ι> , ] . − /
′
(4.4)
Dari persamaan (4.4) maka bentuk #3 | g |2 dalam persamaan
∞
(4.2) dapat ditulis menjadi
0 ( |) g( |)2 =∫0 ( ) exp {− 2 ( − ) [5Ι( , )]

1
∫∞ ∞ ′ ̂
( − )}g( |)2 (4.5).

commit to user
16
Karena g |2 = 1 maka persamaan (4.5) dapat ditulis menjadi
#3 | g θJ |k2 = #3 . :/ exp L− . − / M5Ι>. , /N. − /O
∞ ∞ ′
g |2
1
= . :/ P exp Q− . − / M5Ι>. , /N. − /R
∞
′
3 2
2π ST
= . :/
nΙ>θ J
ST ST
= . :/2π nU [Ι>. , /]
sehingga
7 | = −2 ln./ − 2ln VP | g |2 W

∞
XT XT
= −2 ln./ − 2ln{ . :/2π A nU A [Ι>. , /]}
= −2 ln./ − 2ln . :/ + pJ ln 5 − ln2π + ln Ι>. , /

ST

(4.6).
ln2π dan ln Ι. , / suatu konstanta tetap untuk

ST
Karena bentuk −2 ln./, −
model , persamaan (4.6) dapat disederhanakan menjadi

7 | ∝ −2ln |+Y ln 5
= −2ln| +Y ln 5 (4.7)
dengan,
.: / : fungsi maksimum likelihood
Y : jumlah parameter model
5 : banyaknya data.
Model yang dipilih dengan persamaan (4.7) adalah model yang memberikan nilai
BIC minimum (Cavanaugh, J.2005).
commit to user
17
4.2 BIC dalam Regresi
Metode BIC didasarkan pada metode MLE. Metode MLE ini digunakan
untuk mencari fungsi maksimum likelihood dari model. Sebelum melakukan
pemilihan model dalam kasus regresi linear dengan metode BIC, residu data harus
memenuhi asumsi klasik regresi linear.
Untuk mendapatkan model terbaik perlu dilihat semua kombinasi yang
mungkin dari variabel independen yang berpengaruh terhadap model dan variabel
dependennya. Dari kombinasi yang diperoleh tersebut dipilih model terbaik.
Kombinasi yang paling baik untuk dijadikan model regresi terbaik dapat dilihat
dari nilai BIC yang diperoleh. Nilai BIC yang dipilih adalah nilai BIC terkecil
diantara beberapa kombinasi tersebut. Nilai BIC terkecil yang dimiliki model
berarti variansinya juga terkecil diantara model yang lain. Ini berarti bahwa residu
model yang dipilih kecil sehingga model cukup akurat. Untuk menentukan nilai
BIC dalam model regresi linear perlu diketahui rumus yang digunakan. Penurunan
rumus tersebut dapat diketahui berdasarkan penjelasan di bawah ini.
Bentuk .: / dalam persamaan (4.7) disubtitusikan dengan fungsi
maksimum likelihood untuk regresi linear yaitu Z|, [, sehingga diperoleh
7\] = −2lnZ|, [, + Y ln 5 (4.8)
dengan,
Z|, [, : fungsi maksimum likelihood
Y : banyaknya parameter
5 : banyaknya data.
Karena residu data mengikuti distribusi normal maka dapat dituliskan bentuk
umum fungsi likelihoodnya, sebagai berikut
ef U'f gA
Z|, [, = ∏ab cY d− h (4.9)
√"` A À
commit to user
18
Selanjutnya persamaan (4.7) diubah ke dalam bentuk ln sehingga

5 5 1 ka − a [
ln Z|, [, =− ln2 − ln − i j l
2 2 2
ab
5 5 1 Z − [′ Z − [
ln Z|, [, =− 2 − ln − j l
2 2 2

ln Z|, [, = − ln2 − ln − À MZ ′ Z − 2[ ′ ′ Z + [′ ′ [N (4.10)
dimana Y adalah vektor 51 dan adalah matriks 5.
Kemudian untuk memperoleh [> , dicari turunan pertama dari bentuk
ln Z|, [, terhadap [ sama dengan nol, maka diperoleh
<5 1 Z ′ Z − 2[ ′ ′ Z + [ ′ ′ [
= − j l=0
<[ 2 <[
<5 1
= − [−2′Z + 2′[] = 0
<[ 2
1 ′
[ Z − ′[] = 0

′ [ = ′ Z
Kemudian mengalikan kedua ruas dengan ′ U diperoleh
′ U ′ [ = ′ U ′ Z.
Sehingga diperoleh persamaan untuk [> sebagai berikut
[> = ′ U ′ Z.
Kemudian untuk memperoleh , dicari turunan pertama dari bentuk
lnZ|, [, terhadap sama dengan nol, maka diperoleh
<ln 5 1
= − + n [Z − [′ Z − [] = 0
< 2 2
1 5
[Z − [′ Z − [] =
2 n 2

[Z − [′ Z − [] = 5 (4.11)
À
Sehingga diperoleh persamaan untuk sebagai berikut

= [Z − [′ Z − [].
commit to user
19
Persamaan (4.10) disubtitusikan ke dalam persamaan (4.8), maka diperoleh
5 5 1
7\]opqopra = −2 s− ln2 − ln − MZ ′ Z − 2[ ′ ′ Z + [′ ′ [Nt + Y ln 5
2 2 2

= 5 ln 2 + 5 ln + À [Z ′ Z − 2[ ′ ′ Z + [ ′ ′ [] + Y ln 5 (4.12)
Dengan mensubtitusikan persamaan (4.11) ke dalam persamaan (4.12), maka

diperoleh
7\]opqopra = 5 ln 2 +5 ln u + 5 + Y ln 5
Y
= 5 ln 2 + 5 ln + ln 5 + 5
5
v&
= 5 ln 2 + ln +
ln 5 + 1 (4.13)
Karena 5 konstan maka untuk pemilihan model persamaan (4.13) dapat

disederhanakan menjadi
v&
7\]opqopra = ln 2 + ln +
ln 5 + 1 (4.14)
Model yang baik adalah model yang memiliki nilai variansi yang kecil.
Sehingga dalam menentukan model terbaik dengan BIC dipilih model yang
memiliki nilai BIC yang terkecil sesuai persamaan (4.14).
4.3 Contoh Aplikasi Pemilihan Model Regresi Terbaik dengan BIC

Metode BIC dapat diterapkan dalam regresi linear. Sebagai penerapan dari
metode BIC digunakan data dari Badan Pusat Statistik tahun 2009 dengan
produksi padi sebagai Z, jumlah benih sebagai , luas panen sebagai , dan
produktivitas padi sebagai w , yang dapat dilihat pada lampiran 1. Data diuji
apakah ada pelanggaran asumsi klasik yaitu normalitas, tidak terdapat
multikolinearitas, tidak terdapat heteroskedastisitas dan tidak terdapat
autokorelasi. Data diregresikan dengan regresi linear biasa, diperoleh persamaan
Z = −927579.8 + 5.466520 + 5.496041 + 15769.99w (lampiran5). Kemudian
residu dari persamaan regresi linear tersebut diuji memenuhi asumsi normalitas,
multikolinearitas heteroskedastisitas dan autokorelasi.
commit to user
20
1. Asumsi Normalitas
Pengujian kenormalan digunakan untuk mengetahui apakah residu
berdistribusi normal atau tidak. Plot kenormalan untuk residu dari model
produksi padi disajikan pada gambar 4.1.
Probability Plot of RESI1

Normal
99
Mean -7.05547E-11
StDev 312079
95 N 33
90 KS 0.141
P-Value 0.095
80
70
Percent
60
50
40
30
20
10
5
00 00 00 00 0 00 00 00 00
000 000 000 000 000 0 00 000 0 00
-8 -6 -4 -2 2 4 6 8
RESI1
Gambar 4.1 Plot probabilitas dari residu
Gambar 4.1 terlihat bahwa pola penyebaran residu mengikuti garis lurus, ini
berarti asumsi kenormalan pada residu dipenuhi. Untuk menguji kenormalan
dapat juga digunakan uji Kolmogorov-Smirnov sebagai berikut
a. 3 ∶ residu berdistribusi normal
∶ residu tidak berdistribusi normal
b. Tingkat signifikasi = 0.05
c. Daerah kritis, 3 ditolak jika p-value < = 0.05
d. Statistik uji
Dari Gambar 4.1 terlihat bahwa p-value = 0.095
e. Kesimpulan
Karena nilai p-value = 0.095 > 0.05 maka 3 tidak ditolak yang berarti
residu berdistribusi normal.
commit to user
21
2. Uji Multikolinearitas
Uji multikolinieritas bertujuan untuk mengetahui apakah terdapat korelasi
antara variabel independen dalam model regresi. Berdasarkan perhitungan
nilai VIF sesuai lampiran 2 didapatkan,
Tabel.4.1 Hasil Uji Multikolinearitas

No Variabel VIF Kesimpulan
1 1.196 Tidak terdapat multikolinearitas
2 1.488 Tidak terdapat multikolinearitas
3 w 1.336 Tidak terdapat multikolinearitas
Berdasarkan tabel 4.1 diperoleh nilai VIF semua variabel independen kurang
dari 10 sehingga asumsi tidak terdapat multikolinearitas terpenuhi.
3. Uji Heteroskedastisitas
Versus Fits
(response is y)
500000
250000
Residual
-250000
-500000
-750000
0 2000000 4000000 6000000 8000000 10000000 12000000

Fitted Value
Gambar 4.2. Plot residu dengan Z

Berdasarkan gambar 4.2 menunjukkan plot tidak membentuk pola tertentu
sehingga asumsi tidak terdapat heteroskedastisitas terpenuhi.
4. Uji Autokorelasi
Autokorelasi diartikan sebagai korelasi antara anggota serangkaian observasi
yang diurutkan menurut waktu. Uji non autokorelasi dapat dideteksi dengan
uji Durbin Watson (d).
commit to user
22
a. 3 ∶ = 0, artinya tidak ada autokorelasi

∶ ≠ 0, artinya ada autokorelasi
c. Daerah kritis: Pada =3 dan 5=33 serta = 0.05 diperoleh nilai
2$ = 1.26 dan 2 = 1.65 sesuai lampiran 4, sehingga 4 − 2$ = 2.74 dan
4 − 2 = 2.35
d. Statistik Uji
Berdasarkan uji Durbin Watson (d) didapatkan nilai 2aq = 1.724
sesuai lampiran 3.
e. Kesimpulan
Karena 2 = 1.6511 < 2aq = 1.724 < 4 − 2 = 2.3455, maka
dapat disimpulkan asumsi tidak terdapat autokorelasi terpenuhi.
Selanjutnya dilakukan pengujian parameter yaitu uji simultan dan uji
parsial. Uji simultan untuk model dengan tiga variabel independen yaitu, ,
dan w adalah
a. 3 ∶ [a = 0, = 1,2,3 (variabel independen , dan w secara simultan tidak
berpengaruh terhadap variabel dependen Y)
b. ∶ [a ≠ 0, = 1,2,3.(variabel independen , dan w secara simultan
berpengaruh terhadap variabel dependen Y)
c. Tingkat signifikasi = 0.05
d. Daerah Kritis, 3 ditolak jika aq > ,vU,Uv
e. Statistik Uji
Dari tabel 4.2 terlihat bahwa aq = 901.71
f. Kesimpulan
Karena nilai aq = 901.71 > 3.3,w, = 3.93 maka 3 ditolak yang
berarti bahwa variabel independen , dan w secara simultan berpengaruh
terhadap variabel dependen Y.
commit to user
23
Tabel 4.2 Hasil Uji F

Sumber variasi Derajat Jumlah Rata-rata aq P-value
bebas kuadrat kuadrat
Regresi 3 2.90714E+14 9.69048E+13 901.71 0.000
Sisa 29 3.11658E+12 1.07468E+11
Total 32 2.93831E+14
Kemudian dilakukan uji parsial untuk mengetahui ada atau tidaknya

pengaruh , , dan w terhadap Y. Uji parsial untuk model dengan tiga variabel
independen yaitu, , dan w adalah
a. 3 : [ = 0, untuk = 1, 2,3 (tidak ada pengaruh yang signifikan antara
variabel independen ke-j terhadap variabel dependen)
∶ [ ≠ 0, untuk = 1, 2,3 (ada pengaruh yang signifikan antara variabel
indenpenden ke-j terhadap variabel dependen)
c. Daerah kritis, 3 ditolak jika aq > /,Uv atau −aq < /,Uv
atau p-value < = 0.05
d. Statistik uji
Dari tabel 4.3 terlihat bahwa
a. Nilai ℎ5 variabel sebesar 1.45
b. Nilai ℎ5 variabel sebesar 40.98
c. Nilai ℎ5 variabel w sebesar 2.26
e. Kesimpulan :
a. Karena aq = 1.45 > 3.3, = 2.045 maka 3 tidak ditolak yang
berarti bahwa tidak ada pengaruh yang signifikan dari variabel independen
terhadap variabel dependen Z.
b. Karena aq = 40.98 > 3.3, = 2.045 maka 3 ditolak yang berarti
bahwa ada pengaruh yang signifikan dari variabel independen terhadap
variabel dependen Z.
c. Karena aq = 2.26 > 3.3, = 2.045 maka 3 ditolak yang berarti
bahwa ada pengaruh yang signifikan dari variabel independen w terhadap
variabel dependen Z.
commit to user
24
Tabel 4.3 Hasil Uji t

Variabel Koefisien aq p-value
Konstanta -927580 -3.21 0.003
X 5.467 1.45 0.157
X 5.4960 40.98 0.000
Xw 15765 2.26 0.031
Karena tidak mempunyai pengaruh yang signifikan terhadap Z maka

variabel tidak dimasukkan dalam kombinasi model, hanya kombinasi model
dari variabel dan w yang akan dimasukkan dalam kombinasi model dan
dipilih sebagai model terbaik menurut metode BIC. Sehingga ada 2 = 4
kombinasi model dan ada 3 kombinasi model yang akan dipilih.
Nilai BIC dalam tabel 4.4 menurut rumus pada persamaan (4.14) dapat
dihitung dengan:
a. Hitung nilai u dari masing-masing kombinasi model
v&
b. Hitung nilai

ln5 dari masing-masing kombinasi model
c. Hitung nilai ln2

d. Hitung nilai BIC dari masing-masing kombinasi model yang diperoleh
v&
dari ln2 + lnu +
ln5 + 1
e. Pilih model dengan nilai BIC terkecil.
Tabel 4.4 Nilai BIC dari Model

7\]opq =
Variabel Y Y
lnu ln5 Y
5 5
No
ln 2 + ln + ln 5 + 1
5
independen
1 X 25.5057 0.0606 0.21189 28.5550

2 Xw 29.4816 0.0606 0.21189 32.5309
3 X, Xw 25.3405 0.0909 0.31783 28.4957
commit to user
25
Model terbaik menurut metode BIC adalah model dengan nilai BIC
terkecil. Berdasarkan tabel 4.4 model yang memiliki nilai BIC terkecil adalah
model yang dipengaruhi oleh variabel independen dan w yaitu variabel
independen luas panen dan produktivitas padi. Model tersebut mempunyai BIC
sebesar 28.4957. Sehingga berdasarkan output minitab pada lampiran 5 diperoleh
persamaan Z = −938452 + 5.56 + 16454w . Hal ini berarti, untuk setiap
kenaikan satu hektar luas panen menaikkan nilai produksi padi sebesar 5.56 ton
dan untuk setiap kenaikan satu kuintal/hektar produktivitas padi menaikkan nilai
produksi padi sebesar 16454 ton. Jika dan w bernilai nol maka produksi padi
sebesar −938452 ton. Berarti, jika dan w bernilai nol maka produksi padi
akan mengalami kerugian sebesar 938452 ton.
commit to user
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil dari pembahasan pada bab 4 dapat ditarik suatu kesimpulan
sebagai berikut :
1. Bentuk umum BIC yang dirumuskan dengan menerapkan teorema Bayes dalam
mencari probabilitas posterior model , dapat ditulis
| = −2ln + ln .
2. Model regresi terbaik dengan metode BIC diperoleh dengan memilih model yang
memiliki nilai BIC terkecil. Nilai BIC dalam regresi dihitung dengan
#$
= ln2 + ln ! " + ln + 1.
%
5.2 Saran
BIC merupakan salah satu metode pemilihan model yang memiliki hasil
cukup akurat. Bagi pembaca yang tertarik pada pemilihan model terbaik dengan BIC
dapat mengembangkan penggunaan BIC dalam analisis runtun waktu.
commit to user
26
27
DAFTAR PUSTAKA
Bain, L.J, and Engelhardt, M. (1992). Introduction to Probability and Mathematical

Statistic, Second ed.,Duxbury Press, Inc, California.
Cavanaugh, J. (2005) Model Selection, The Schwarz Information criterion (SIC).
Department Biostatistics. The University of Lowa. google search:Bayesian
Information Criterion+BIC.
Fathurahman, M. (2009) Pemilihan Model Regresi Terbaik Menggunakan Metode
Akaike’s Information Criterion dan Schwarz Information Criterion. Jurnal
Informatika Mulawarman. Vol 4. 37– 41.
Gujarati, D. (1995). Basic Econometrics. McGraw Hill Inc., Singapore.
Kass, R. E. and Raftery, A. E. (1995) Bayes Factor. Journal of The American

Statistical Associations. Vol. 90. 773-795.
Larson, H. J. (1974). Introduction to Probability Theory and Statistical Inference.
John Wiley & Sons, Inc, New York.
Montgomery, D.C, and Peck, E.A. (1992). Introduction to Linear Regression
Analysis second edition. John Wiley & Sons, Inc, New York.
Neter, J and Wasserman,W. (1996). Applied Linear Regression Models. The

McGraw-Hill Companies.
Schwarz, G. (1978). Estimating the Dimension of Model. Annals of Statistic 6.
Sembiring, R.K. (1995). Analisis Regresi. Penerbit ITB. Bandung.
Supranto, J. (1995). Ekonometrika Buku I. LPFE-UI1. Jakarta.
Walpole, R. E. dan Myers, R. H.(1995). Ilmu Peluang dan Statistika untuk Insinyur
dan Ilmuwan. Terjemahan R. K. Sembiring. Edisi Kedua. ITB. Bandung.
commit to user

Nurul Kustinah M0106057

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Nurul Kustinah M0106057

Diunggah oleh

Hak Cipta:

Format Tersedia

perpustakaan.uns.ac.id digilib.uns.ac.

PEMILIHAN MODEL REGRESI TERBAIK DENGAN

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

yang disiapkan dan disusun oleh

Dra. Yuliana Susanti, M.Si Bowo Winarno, S.Si, M.Kom

Anggota Tim Penguji Tanda Tangan

Ir. Ari Handono Ramelan, MSc., PhD Irwan Susanto, DEA

Nurul Kustinah, 2011. PEMILIHAN MODEL REGRESI TERBAIK

Kata kunci: regresi linear, teorema Bayesian, MLE, BIC.

Nurul Kustinah, 2011. THE BEST SELECTION REGRESSION MODEL

Keywords: linear regression, Bayesian theorem, MLE, BIC.

“Sesungguhnya sesudah kesulitan itu ada kemudahan.”

“Dan Dia mendapatimu sebagai seorang yang bingung,

Karya ini kupersembahkan untuk

Ibu dan Bapak tercinta

Yang tiada henti mendoakan aku

Kakakku Mas Rochim dan mbak Ita

Adikku Tirta dan Riyanti

Kak Gilang dan keluarga atas semua fasilitasnya

Valui Aditya dengan bantuan laptopnya

Surakarta, 2 Januari 2012

4.2 BIC dalam Regresi ...................................................................... 17

1.1 Latar Belakang Masalah

1.2 Perumusan Masalah

1.3 Tujuan Penelitian

1.4 Manfaat Penelitian

2.1 Tinjauan Pustaka

2.1.1 Probabilitas bersyarat

Probabilitas terjadinya suatu peristiwa A, bila diketahui peristiwa B telah terjadi

Definisi 2.2 S suatu ruang sampel dan A, B adalah peristiwa-peristiwa di dalam

Dikatakan bahwa A1 , A2, ... , Ak membentuk partisi dalam S.

P(B)=P(B|A1)P(A1)+P(B|A2)P(A2)+ ... +P(B|Ak)P(Ak).

2.1.2 Estimasi Maksimum Likelihood

&# = ∏  ! ; # = !  ; #!  ; # … !  ; #.

Definisi 2.5. Misalkan &# = !  ,  , … ,  ; # dengan # $ %, adalah fungsi

Memaksimumkan log &# lebih mudah dibandingkan memaksimumkan

Apabila Ω adalah interval terbuka dari L(# yang differensiabel dan

2.1.3 Distribusi Prior dan Distribusi Posterior

Definisi 2.7. Fungsi kepadatan posterior untuk # merupakan fungsi kepadatan

Secara umum, distribusi posterior menggambarkan tingkat keyakinan terhadap

2.1.4 Teorema Bayes

2.1.5 Faktor Bayes

Faktor Bayes sangatlah berhubungan dengan distribusi prior, hal ini

2.1.6 Uji Asumsi Klasik

Montgomery dan Peck (1992) menggambarkan beberapa plot sisa terhadap

Gambar 2.1 Pola plot residu terhadap t(

2.1.7 Analisis Model Regresi

e. Kesimpulan : Jika de ditolak maka variabel independen secara bersama-sama

2.1.7.2 Uji Parsial (Uji t)

d ∶ 9 ≠ 0, untuk 8 = 1, 2, … ,  (ada pengaruh yang signifikan antara variabel

2.2 Kerangka Pemikiran

c. Hitung nilai ln2ߨ

BIC merupakan metode pemilihan model terbaik dari beberapa kandidat

4.1 Bayesian Information Criterion (BIC)

BIC adalah metode pemilihan model dari beberapa kandidat model.

dimana  merupakan distribusi marginal dari .

Berdasarkan data sampel, probabilitas posterior model  dapat ditulis

" # $%& |'( %& |)%&

Dalam pemilihan model dengan aturan Bayes, akan memilih model 

−2ln!|)∝ −2ln()−2ln0#3  | g  |2 4 = 7 |

= ln. :/ − . −  / [5Ι> , ] . −  /

Ι>. , / merupakan rata-rata pengamatan matriks informasi Fisher.

(4.2) dapat ditulis menjadi

&# = ∏ ! ; # = ! ; #! ; # … ! ; #.

Definisi 2.5. Misalkan &# = ! , , … , ; # dengan # $ %, adalah fungsi

Memaksimumkan log &# lebih mudah dibandingkan memaksimumkan

Apabila Ω adalah interval terbuka dari L(# yang differensiabel dan

d ∶ 9 ≠ 0, untuk 8 = 1, 2, … , (ada pengaruh yang signifikan antara variabel

dimana merupakan distribusi marginal dari .

Berdasarkan data sampel, probabilitas posterior model dapat ditulis

" # $%& |'( %& |)%&

Dalam pemilihan model dengan aturan Bayes, akan memilih model

−2ln!|)∝ −2ln()−2ln0#3 | g |2 4 = 7 |

= ln. :/ − . − / [5Ι> , ] . − /

Ι>. , / merupakan rata-rata pengamatan matriks informasi Fisher.

0 ( |) g( |)2 =∫0 ( ) exp {− 2 ( − ) [5Ι( , )]

( − )}g( |)2 (4.5).

Karena g |2 = 1 maka persamaan (4.5) dapat ditulis menjadi

7 | = −2 ln./ − 2ln VP | g |2 W

= −2 ln./ − 2ln . :/ + pJ ln 5 − ln2π + ln Ι>. , /

ln2π dan ln Ι. , / suatu konstanta tetap untuk

model , persamaan (4.6) dapat disederhanakan menjadi

Gambar 4.2. Plot residu dengan Z

a. 3 ∶ = 0, artinya tidak ada autokorelasi

Karena tidak mempunyai pengaruh yang signifikan terhadap Z maka

c. Hitung nilai ln2