Y (Persentase Pe
X1 (Tingkat Peng 0.027
0.881
X2 (Pengeluaran -0.409
0.016
X3 (Persentase B -0.021
0.906
X4 (Rata-rata la -0.594
0.000
Metode yang digunakan disini adalah regresi spline dengan GAM (Generalized Additive
Model). Setelah meregresikan (spline) Y terhadap X1, X2, X3, X4, dan X5, ternyata sintaks dari
package mgcv yang digunakan tidak dapat dijalankan karena jumlah data yang terlalu sedikit, yaitu
hanya sebanyak 35 baris data. Oleh karena itu, saya melalukan pereduksian peubah. Yang pertama
dilakukan adalah mengecek korelasi dari kelima peubah penjelas dengan peubah respon.
Berdasarkan output di atas, diketahui bahwa terdapat dua peubah penjelas yang tidak
signifikan sehingga dapat dikatakan bahwa peubah X1 dan X3 tidak berkorelasi nyata terhadap
peubah Y sehingga peubah tersebut akan direduksi. Jadi, variabel yang akan digunakan dalam
regresi spline ini hanya X2, X4, dan X5. Berikut output yang dihasilkan :
Family: gaussian
Link function: identity
Formula:
Y ~ s(X2, k = -1) + s(X4, k = -1) + s(X5, k = -1)
Parametric coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 13.031 0.169 77.09 <2e-16 ***
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Berikut merupakan hasil analisis regresi spline dengan peubah penjelas X2, X4, dan X5.
Ketiga peubah penjelas tersebut signifikan terhadap modelnya, namun nilai R2(ajd) hanya sebesar
61,7%. Untuk bentuk model sendiri, masih dalam proses mencari, karena outputnya hanya berupa
koefisien dan posisi knotnya belum diketahui. Berikut merupakan plot data :
Output di atas merupakan keterangan dari jumlah iterasi yang digunakan yaitu sebanyak
22 iterasi hingga konvergen. Kemudian untuk tiap peubah penjelas memiliki basis dimensi k,
dimana knot yang digunakan merupakan k-1, artinya knot yang digunakan adalah sebanyak 8
untuk tiap peubahnya. Knot tersebut merupakan jumlah knot optimum yang telah dihitung
otomatis oleh package. Dan dari output juga dapat diketahui bahwa nilai p-valuenya mendekati
1 yang memiliki arti bahwa k yang digunakan sudah optimum.
Berikut merupakan hasil uji asumsi sisaan, dari hasil tersebut dapat dilihat secara
eksploratif bahwa plot deviance sudah cukup dekat dengan garis. Plot residual vs linear pred
menunjukkan bahwa sisaan sudah homogen karena memiliki lebar pita sama dan tidak berpola
atau saling bebas. Bentuk sebaran dari sisaan juga sudah cukup bagus namun sedikit menjulur ke
kanan. Plot response vs fitted value juga menunjukkan garis linear sebesar 45 derajat yang artinya
nilai peubah respon dengan nilai fitnya sudah bagus atau tepat.
Pertanyaan :
1. Apakah sudah cukup Bu, jika saya menggunakan peubah penjelas sebanyak 3
peubah saja ? Namun, saya bingung karena memang peubahnya tidak dapat
ditambah dengan jumlah data yang hanya sebanyak 35.
2. Nilai R2(adj) masih cukup kecil, namun jika ditambah knotnya tidak
mempengaruhi nilai R2(adj) tersebut karena jumlah knot yang digunakan sudah
optimum. Bagaimana kira-kira cara mengatasinya Bu ?
3. Saya mohon pendapat dan saran Ibu atas hasil yang telah saya dapatkan.