Tujuan: untuk mendapatkan model yang sederhana tetapi cukup baik menjelaskan keadaan data (disebut parsimony).
Secara umum, metode penentuan model terbaik, dibedakan menjadi: 1.Metode tanpa seleksi variabel independen. Metode yang memasukkan seluruh variabel independen yang diduga berpengaruh ke dalam model dan mengakomodasi adanya kolinieritas/multikolinieritas. Contoh : Principle Component Regression (Regresi Komponen Utama), Ridge Regression (Regresi Gulud)
2.Metode dengan seleksi. Metode yang melakukan seleksi variabel independen yang masuk ke dalam model sesuai dengan kriteria/prosedurnya Contoh : Metode Backward, Forward, Stepwise, Best subset regression
2. MSE terkecil
Contoh : Akan dianalisis model regresi yang terdiri dari 4 variabel bebas, Pembagian kelompoknya
1. Kelompok A terdiri dari koefisien intersep Y 0 2. Kelompok B terdiri dari 1 variabel bebas Y 0 1 X 1 3. Kelompok C terdiri dari 2 variabel bebas
Y 0 1 X 1 2 X 2
4. Kelompok D terdiri dari 3 variabel bebas
Y 0 1 X 1 2 X 2 3 X 3
5. Kelompok E terdiri dari 4 variabel bebas
Y 0 1 X 1 2 X 2 3 X 3 4 X 4
Misal diperoleh persamaan regresi yang menduduki posisi utama dalam setiap kelompok adalah
Kelompok Model Regresi B Y = f(X4) C Y = f(X1 , X2) Y = f(X1 , X4) D Y = f(X1 , X2 , X4) E Y = f(X1 , X2 , X3, X4)
4. Forward Selection
Memasukkan variabel bebas yang memiliki korelasi yang paling erat dengan variabel tak bebasnya (variabel yang paling potensial untuk memiliki hubungan linier dengan Y). kemudian secara bertahap memasukkan variabel bebas yang potensial berikutnya dan nanti akan terhenti sampai tidak ada lagi variabel bebas yang potensial.
Dengan menggunakan Minitab lakukan langkah berikut: Stat > Regression > Stepwise>Methods