Anda di halaman 1dari 1

1.

Regresi Himpunan Bagian Terbaik (Best-Subset)


Best Subsets Regression: y versus x1; x2; x3; x4
Response is y
Vars
1
1
1
1
2
2
2
2
3
3
3
3
4

R-Sq
67,5
66,6
53,4
28,6
97,9
97,2
93,5
84,7
98,2
98,2
98,1
97,3
98,2

R-Sq(adj)
64,5
63,6
49,2
22,1
97,4
96,7
92,2
81,6
97,6
97,6
97,5
96,4
97,4

Mallows
Cp
138,7
142,5
202,5
315,2
2,7
5,5
22,4
62,4
3,0
3,0
3,5
7,3
5,0

S
8,9639
9,0771
10,727
13,278
2,4063
2,7343
4,1921
6,4455
2,3087
2,3121
2,3766
2,8638
2,4460

x x x x
1 2 3 4
X
X
X
X
X X
X
X
X X
X X
X X
X
X X X
X
X X
X X X
X X X X

Berdasarkan hasil pengolahan menggunakan Minitab, terlihat bahwa hasil model regresi yang
menggunakan tiga variabel (k=3) menghasilkan nilai Cp Mallow yang paling mendekati dengan k.
3
3

98,2
98,2

97,6
97,6

3,0
3,0

2,3087
2,3121

X X
X
X X X

Dapat disimpulkan bahwa model regresi terbaik adalah dengan menggunakan variabel x1,x2 dan
x4 atau model regresi yang menggunakan variabel x1,x2 dan x3 dengan masing-masing R-square
yang sama dengan nilai 97,6%.
Namun, Best-subset mempunyai kelemahan yang cenderung menghasilkan persamaan regresi
dengan terlalu banyak variabel. Jika jumlah variabel diambil terlalu kecil persamaan regresi yang
paling masuk akal untuk dipilih malah tidak muncul dalam himpunan Best-subset walau mungkin
muncul di tempat lain.

Anda mungkin juga menyukai