Aplikasi
Aplikasi yang akan ditunjukkan tentang regresi semi parametrik adalah hubungan
antara produksi billet (y) dengan scrap (x1) dan POT (x2). Jumlah sampel yang digunakan
adalah 64 produksi billet selama satu minggu (Budiantara, 2005).
Hubungan x dengan y, dapat dituliskan sebagai berikut :
yi f x1 , x2 i , i 1, 2,L ,64
Plot hubungan antara y dengan x1 dan x2 ditunjukkan pada Gambar 1 dan 2 berikut.
3000000
Jumlah.Produksi
Produksi.Billet
3000000
2000000
2000000
1000000
1000000
1000000
2000000
Scrap
3000000
4000000
4000
4200
4400
4600
4800
5000
5200
POT
3000000
Jumlah.Produksi
Produksi.Billet
3000000
2000000
2000000
1000000
1000000
0
0
1000000
2000000
Scrap
3000000
4000000
4000
4200
4400
4600
4800
5000
5200
POT
Melalui estimasi regresi parametrik linear secara parsial untuk variabel x1 dan x2
masing-masing menunjukkan hubungan antara y dengan x1 adalah suatu hubungan linear
dan positif, artinya semakin tinggi scrap maka produksi billet juga akan mengalami
peningkatan (Gambar 3). Berbeda pada hubungan y dengan x2 yang diestimasi dengan
regresi parametrik linear, pola data tidak terestimasi dengan baik sehingga tidak dapat
digunakan sebagai model estimasi khususnya pada hubungan y dengan x2. Pencaran data
yang menyebar di luar garis estimasi sangat banyak, sehingga sangat sulit untuk
melakukan suatu prediksi terhadap hubungan antara POT dengan produksi billet. Untuk
itu, model estimasi yang akan digunakan adalah regresi nonparametrik spline linear.
Untuk mendapatkan spline optimal maka dipilih titik knots k yang optimal dengan
menggunakan metode GCV, yaitu model spline optimal pada nilai GCV yang terkecil.
Pemilihan titik knots dilakukan dengan memulai dari 1 knots, dan diperoleh GCV
terkecil 693.654.628.934 pada k = 4255. Pada 2 knots, GCV terkecil 687.597.317.004
yang bersesuain dengan k1 = 4300 dan k2 = 4500, pada 3 knots, GCV terkecil
655.927.567.748 yang bersesuain dengan k1 = 4320, k2 = 4500 dan k3 = 4700, dan pada 4
knots, GCV terkecil 655927567748 yang bersesuain dengan k1 = 4320, k2 = 4550,
k3 = 4700 dan k4 = 4740 Dari hasil GCV tersebut, berarti knots optimal terdapat pada
penggunaan 4 titik knots yaitu pada titik 4320, 4550, 4700 dan 4740.
Estimasi pola hubungan produksi billet dengan POT secara parsial ditunjukkan
pada Gambar 5, berupa spline linear dengan 4 knots. Pola estimasi ini sudah
menunjukkan suatu pola estimasi yang cukup optimal untuk memprediksi hubungan POT
dengan produksi billet. Pada nilai terendah hingga 4320 POT, produksi billet mengikuti
pola linear yaitu produksi billet mengalami penurunan. Pada interval 4320 hingga 4550
produksi billet mengalami kenaikan kemudian turun secara tajam hingga 4700 POT. Pada
interval 4700 hingga 4740 produksi billet mengalami kenaikan tetapi setelah itu, produksi
billet terus mengalami penurunan.
Estimasi model regresi semiparametrik yang terbentuk dalam hubungan y dengan
x1 dan x2 (Tabel 2), adalah :
y 14631129,83 0,79 x1 2959,98 x2 8226,84 x2 4320
1
2*10^6
5*10^5
10^6
produksi billet
3*10^6
4000
4200
4400
4600
4800
5000
5200
POT
GCV
693654628934
687597317004
655927567748
608623829883
Estimasi
14.631.129,83
0,79
-2.959,98
8.226,84
-19.634,71
53.648,81
-40.227,68
4. Kesimpulan
Kesimpulan dari beberapa uraian di atas adalah sebagai berikut :
a. Penggunaan regresi semiparametrik dengan spline linear relatif lebih mudah dan
sederhana dan interpretasi yang sangat baik.
b. Spline linear dengan empat knots cukup baik untuk menjelaskan hubungan billet
dengan POT dibandingkan penggunaan regresi parametrik.