Modul Praktikum 3 - Regresi Berganda
Modul Praktikum 3 - Regresi Berganda
I. TUJUAN
1. Praktikan mampu memahami konsep-konsep dan prinsip dasar pada analisis peramalan
kausal (regresi berganda)
2. Praktikan mampu menjalankan prosedur analisis peramalan kausal dengan Aplikasi Stata.
3. Praktikan mampu melakukan interpretasi hasil analisis peramalan kausal (regresi
berganda) dalam konteks PWK.
Dalam peramalan kausal, terdapat sejumlah asumsi yang digunakan. Asumsi-asumsi yang
digunakan adalah sebagai berikut ini.
• Variabel yang akan diramal menunjukkan suatu hubungan sebab akibat dengan satu atau lebih
variabel yang lain.
• Bersifat kuantitatif dan terdapat hubungan sebab akibat. Variabel yang digunakan terdiri dari
variabel bebas dan terikat, bentuk hubungan fungsional dapat berupa time series maupun cross
section.
• Memenuhi asumsi model regresi. Secara khusus, dalam model regresi terdapat sejumlah asumsi
seperti berikut ini.
o Setiap nilai variabel prediktor X ada suatu distribusi probabilitas dari nilai-nilai kriteria
Y. Untuk setiap distribusi Y, satu atau lebih diambil sampel secara random,
o Variansi distribusi Y semuanya sama satu dengan yang lain (homosedasticity).
o Rata-rata distribusi Y jatuh pada garis regresi Y=+βX, dimana Y adalah rata-rata
distribusi Y untuk nilai X tertentu, β adalah kelerengan garis regresi, perpotongan
garis regresi dengan sumbu Y.
1
• Memenuhi kriteria estimasi hubungan, yaitu kriteria least square.
• Memenuhi keakuratan model, yang terdiri dari kesalahan baku dan proporsi variansi yang
dijelaskan model.
• Memenuhi keberartian persamaan regresi.
Secara umum, analisis regresi terbagi menjadi analisis regresi sederhana dan analisis regresi
berganda. Persamaan regresi sederhana dapat dinyatakan dalam persamaan Y=a+bX. Sedangkan
regresi berganda merupakan perluasan dari regresi sederhana. Regresi berganda menyatakan
hubungan antara satu variabel dependen dengan satu atau lebih variabel independen. Persamaan
regresi berganda dapat dinyatakan seperti berikut:
dengan Y’ adalah nilai prediksi dari variabel; a, b merupakan koefisien yang ditentukan
berdasarkan data sampel; dan X1, X2……,Xk merupakan variabel prediktor.
Tahapan penting dalam analisis regresi adalah seleksi variabel prediktor. Prosedur dalam seleksi
variabel prediktor adalah sebagai berikut.
• Membuat daftar panjang variabel prediktor. Variabel prediktor atau independen dapat diperoleh
dari teori dan logika hasil studi literatur, serta arahan pakar.
• Membuat daftar pendek variabel prediktor. Persamaan regresi hendaknya mempunyai variabel
prediktor sesedikit mungkin sehingga variabel prediktor yang tidak terlalu berperan harus
dihapus.
Seleksi variabel prediktor dapat dilakukan dalam berbagai cara, antara lain adalah plot variabel
bebas terhadap variabel terikat, hitung inter-korelasi, analisis faktor melalui prosedur lain
diantaranya “stepwise”. Prosedur stepwise terdiri dari prosedur forward dan prosedur backward.
a. Backward Elimination
Metode ini dimulai dengan memasukkan semua variabel terlebih dahulu, kemudian
dilakukan analisis. Variabel yang tidak layak masuk dalam regresi akan dikeluarkan
satu per satu.
b. Forward Elimination
Metode ini dilakukan dengan memasukkan variabel independen satu per satu.
Multikolineariti
2
Multikolineariti harus dihindari dengan alasan berikut.
• Bila multicollinierarity terjadi dalam model regresi berganda, solusi least square tidak mungkin
dihasilkan. Hal ini disebabkan karena solusi least square dipengaruhi oleh error yang
berlebihan.
• Kestabilan model regresi berganda dipengaruhi oleh multicollinierarity. Standart error
koefisien dipengaruhi oleh korelasi variabel bebas, semakin besar korelasi, dan koefisien
semakin tidak stabil.
• Dapat mempengaruhi hasil peramalan, yaitu hasil peramalan menjadiover estimate.
Multikolineariti dapat dihindari dengan beberapa alternatif cara yang diantaranya adalah sebagai
berikut.
• Menyisihkan atau membuang data ekstrim dalam suatu variabel.
• Memperbesar ukuran sampel.
• Memasukan persamaan tambahan atau data baru ke dalam model.
• Menghubungkan data cross section dan data time series.
• Membuang salah satu atau beberapa variabel yang berkorelasi tinggi.
• Mentransformasikan variabel.
• Melakukan teknik pemodelan yang lebih kompleks terlebih dahulu seperti analisis faktor
sehingga variabel-variabel yang menyebabkan multikolineariti akan difiltrasi terlebih dahulu.
Dummy Variable
Dalam membuat persamaan regresi, variabel independen yang bersifat kualitatif (data nominal atau
ordinal) tetap dapat digunakan. Hanya saja data yang bersifat kualitatif tidak dapat digunakan
secara langsung. Variabel tersebut harus diubah menjadi variabel dummy. Variabel dummy
dinyatakan dalam nilai 1 dan 0, nilai 1 untuk nilai yang diinginkan, dan nilai 0 untuk nilai yang
tidak diinginkan. Suatu variabel dummy equivalen dengan variabel regresor baru. Bila digunakan
variabel kualitatif dengan n kriteria, maka gunakan n variabel dummy untuk menunjukkan n
kriteria yang berbeda.
- Nama Kabupaten/Kota
- Jumlah penduduk
- Jumlah produksi padi
- Jumlah ternak yang keluar
- Jumlah tenaga kerja industri kecil menengah
- Jumlah tenaga kerja industri besar
- Jumlah unit usaha industri kecil menengah
- Jumlah unit usaha industri besar
3
- Jumlah hotel dan akomodasi
- PDRB
Dari 10 variabel diatas, jumlah PDRB tahun 2006 merupakan variabel dependen sedangkan
variabel lainnya digunakan sebagai variabel prediktor. Untuk mengetahui apa saja variabel yang
mempengaruhi jumlah PDRB pada tahun 2006 di Provinsi Jawa Barat, maka digunakan analisis
regresi berganda. Metode yang digunakan dalam analisis regresi berganda kali ini adalah metode
Stepwise. Secara umum, cara kerja dari metode tersebut adalah dengan memasukkan variabel
bebas satu per satu dan variabel yang tidak memiliki korelasi dengan variabel dependen dapat
dikeluarkan.
Adapun tujuan dari pengolahan data tersebut adalah untuk membuat model regresi yang
mengestimasikan besaran PDRB, berdasarkan variabel-variabel lainnya yang memiliki hubungan
dengan variabel PDRB.
4
Jml Jml Jml
Jml
Jml Jml Tenaga Tenaga Unit
Kabupaten/ Jml Unit Jml Hotel
Produksi Ternak Kerja Kerja Usaha PDRB
Kota Penduduk Usaha Akomodasi
Padi Klr (income (income nd
nd bsr
menengah) besar) kclmngh
18 sukabumi 287.760 22.844 9.380 249 19 - - 32 2402017.5
kota
19 2.315.895 24.529 8.999 1.324 99 129 3 253 34.792.184
bandung
kota
20 281.089 3.496 - 57 7 - - 44 6.840.256
cirebon
21 kota bekasi 1.994.850 10.406 12.222 232 15 139 3 16 19.226.332
22 depok 1.373.860 7.668 469 56 7 102 1 5 7.541.666
23 cimahi 493.693 2.930 - - - - - 3 7227777.5
kota
24 594.158 73.773 939 32 6 - - 32 4.617.522
tasikmalaya
25 banjar 173.576 33.030 - 205 25 - - 8 973962.75
Sumber: Badan Pusat Statistik, 2006
Berdasarkan studi kasus tersebut, maka penyelesaian yang dapat dilakukan terdiri dari beberapa
tahapan yang diantaranya adalah: (1) merumuskan masalah; (2) memasukkan data pada Stata, (3)
mengolah data menggunakan Stata; (4) menganalisis dan menginterpretasikan hasil analisis
5
IV.2 Memasukkan Data pada Stata
Klik “Data Editor” pada toolbar. Input data yang dimasukkan adalah data terkait PDRB di
Provinsi Jawa Barat seperti yang tercantum pada Gambar 1.
6
Adapun command yang dilakukan dalam melakukan proses analisis regresi berganda
dengan menggunakan Stata adalah sebagai berikut.
A. Descriptive Statistics
Command: summarize
Tabel pada Gambar 2 di atas menunjukkan variabel-variabel yang akan dianalisis. Obs
merupakan jumlah objek yaitu kabupaten atau kota yang terdapat di Provinsi Jawa Barat.
Variabel PDRB merupakan variabel dependen sedangkan variabel bebas terdiri dari:
(1) jumlah penduduk;
(2) jumlah produksi padi;
(3) jumlah ternak yang keluar;
(4) jumlah tenaga kerja industri kecil menengah;
(5) jumlah tenaga kerja industri besar;
(6) jumlah unit usaha industri kecil menengah;
(7) jumlah unit usaha industri besar; dan
(8) jumlah hotel serta akomodasi.
Dari descriptive statistics tersebut, perlu dilihat apakah terdapat missing value. Tabel
descriptive statistics ini diperuntukkan untuk melihat gambaran karakteristik data yang
dimiliki, dalam hal ini rata-rata dan standar deviasi dari masing-masing variabelnya.
7
B. Correlations
Command: corr $dependen $independen
Gambar 3. Correlations
Tabel tersebut juga menunjukkan korelasi antar variabel, baik itu antara variabel dependen
dengan variabel independen dan juga antar variabel independennya. Variabel dependen (PDRB)
memiliki korelasi paling besar dengan variabel jumlah penduduk yaitu sebesar 0,635 dan
dengan jumlah ternak yang keluar yaitu 0,661. Berdasarkan korelasi ini ada kemungkinan kedua
variabel independen dapat menjelaskan variabel dependen (PDRB). Akan tetapi hal tersebut
harus diperkuat melalui pengujian selanjutnya.
Berdasarkan tabel tersebut dapat dilihat bahwa adanya korelasi yang kuat antar variabel
independen yaitu variabel jumlah unit usaha menengah kecil dan jumlah unit usaha besar
dengan koefisien korelasi 0,94. Tingginya korelasi tersebut dapat mengindikasikan adanya
multikolineariti antara kedua variabel tersebut. Konsekuensinya adalah hanya salah satu
variabel saja yang boleh diambil dalam model.
8
C. Prosedur Regresi Seluruh Variabel
Tabel pada Gambar 4 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,002; yaitu < 0,05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.
Tabel kedua merupakan tabel model regresi tanpa menggunakan prosedur stepwise.
Sehingga seluruh variabel independen yang diinput menjadi variabel prediktor besar
9
PDRB, tanpa memerhatikan tingkat signifikasi masing-masing variabel independen
terhadap variabel dependen.
Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi A)
Y = a + b X1 + b X2 + ….+ e
Y = 1308508 + 6,12701 X1 – 5,4717 X2 + 269,6197 X3 – 112,2583 X4 –
135635,2 X5 – 12413,06 X6 + 2064915 X7 + 42709,48 X8
X1 = jumlah penduduk
X2 = jumlah produksi padi
X3 = jumlah ternak yang keluar
X4 = jumlah tenaga kerja industri kecil menengah
X5 = jumlah tenaga kerja industri besar
X6 = jumlah unit usaha industri kecil menengah
X7 = jumlah unit usaha industri besar
X8 = jumlah hotel serta akomodasi
Asumsi model regresi, variansi distribusi variabel dependen semuanya sama satu
dengan yang lain (Homosedasticity). Hipotesis nol, menyatakan bahwa variansi konstan
(homo). Hal tersebut dapat dilihat dari nilai-p, apabila kurang dari 0,05 artinya hipotesa
nol ditolak, artinya terdapat heteroskedasticity. Pada kasus ini, p bernilai 0,4649 artinya
tidak terdapat heteroskedasticity.
10
Gambar 6. Test VIF
Tabel pada Gambar 6 menunjukkan nilai VIF yang dihasilkan oleh masing-masing
variabel. Pada kasus ini, terdapat multikolinearitas yakni variabel jumlah unit usaha besar
dan variabel jumlah unit usaha kecil menengah. Karena kedua variabel tersebut memiliki
nilai VIF yang berbeda signifikan dengan nilai VIF variabel lainnya.
11
Grafik menunjukkan hasil uji normalitas dari residual.
Command: pnorm ea
Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot dengan
garis semakin kecil, artinya model regresi semakin baik.
5000000 1.00e+07 1.50e+07
Residuals
0 -1.00e+07-5000000
12
Command: qnorm ea
6.0e+07
4.0e+07
PDRB
2.0e+07
0
Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).
13
3) Regresi 7 variabel
Pada tabel di Gambar 11 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,002; yaitu < 0,05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.
14
Tabel kedua merupakan tabel model regresi tanpa menggunakan prosedur stepwise.
Sehingga seluruh variabel independen yang diinput menjadi variabel prediktor besar
PDRB, dengan koefisien dapat dilihat pada tabel. Sehingga dapat dibentuk model
persamaan regresi.
Y = a + b X1 + b X2 + ….+ e
Y = 1359116 + 6,382078 X1 – 5.007644 X2 + 227.3328 X3 – 798.0117 X4 –
86476.28 X5 – 530636.4 X6 + 35116.52 X7
X1 = jumlah penduduk
X2 = jumlah produksi padi
X3 = jumlah ternak yang keluar
X4 = jumlah tenaga kerja industri kecil menengah
X5 = jumlah tenaga kerja industri besar
X6 = jumlah unit usaha industri besar
X7 = jumlah hotel serta akomodasi
Tabel pada Gambar 12 menunjukkan nilai VIF yang dihasilkan oleh masing-
masing variabel. Nilai VIF seluruh variabel berada dibawah 5. Yang berarti setelah
variabel jumlah usaha kecil menengah dibuang, tidak terdapat multikolinearitas pada data
tersebut.
15
digunakan, karena masih terdapat multikolinearitas pada data regresi seluruh variabel
yang menyebabkan model regresi kurang tepat. Selanjutnya dapat dilakukan prosedur
post estimation regresi seperti yang telah dilakukan sebelumnya.
Bagian ini menjelaskan step yang dilakukan, dimulai dengan model kosong. Lalu
variabel satu persatu di masukkan (entered). Variabel yang diperkenankan masuk
kedalam model adalah variabel dengan nilai P>|t| kurang dari 0.05 (level signifikansi).
Tabel pada Gambar terdapat 13 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.
16
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Entered, yang menunjukkan variabel independen yang mempengaruhi variabel dependen.
Berdasarkan analisis Stata dengan metode Stepwise, diperoleh dua variabel independen
yang mempengaruhi PDRB yaitu variabel jumlah ternak yang keluar dan variabel jumlah
penduduk.
Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi b)
Y = a + b X1 + b X2 + ….+ e
Y = 302669,4 + 211,571 X1 + 6,644 X2
X1 = jumlah ternak yang keluar
X2 = jumlah penduduk
Bagian ini menjelaskan step yang dilakukan, dimulai dengan model penuh (dengan
variabel independen yang diinput). Lalu variabel satu persatu di keluarkan (removed).
Variabel yang dikeluarkan dari model regresi adalah variabel dengan nilai P>|t| lebih dari
sama dengan 0.05 (level signifikansi).
17
Tabel pada Gambar 14 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Model yang dihasilkan metode ini sama dengan model sebelumnya (forward)
karena menggunakan level signifikansi yang sama.
Asumsi model regresi, variansi distribusi variabel dependen semuanya sama satu
dengan yang lain (Homosedasticity). Hipotesis nol, menyatakan bahwa variansi konstan
(homo). Hal tersebut dapat dilihat dari nilai-p, apabila kurang dari 0,05 artinya hipotesa
nol ditolak, artinya terdapat heteroskedasticity. Pada kasus ini, p bernilai 0,0008 artinya
terdapat heteroskedasticity. Karena terdapat heteroskedasticity, perlu dilakukan analisis
regresi menggunakan robust untuk menghilangkan data outlier yang menyebabkan
terjadinya penyimpangan asumsi.
18
Tabel pada Gambar 16 menunjukkan nilai VIF yang dihasilkan oleh masing-
masing variabel. Pada kasus ini, tidak terdapat multikolinearity karena kedua variabel
tersebut tidak memiliki nilai VIF yang berbeda secara signifikan dengan nilai VIF
variabel lainnya.
Command: pnorm eb
19
Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.
Command: qnorm eb
Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).
20
E. Prosedur Stepwise menggunakan Robust
Untuk menghilangkan kasus heteroskedasticity yang terdapat pada regresi stepwise,
dapat dilakukan analisis regresi menggunakan robust yaitu dengan terjelaskannya standar
error dan membuang outlier data yang menyebabkan kasus heteroskedasticity terjadi.
Bagian ini menjelaskan step yang dilakukan, dimulai dengan model kosong. Lalu
variabel satu persatu di masukkan (entered). Variabel yang dikeluarkan dari model regresi
adalah variabel dengan nilai P>|t| lebih dari sama dengan 0.05 (level signifikansi).
Tabel pada Gambar 21 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0.000, maka <0.05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.
21
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Berdasarkan analisis Stata dengan metode Stepwise yang di Robust, diperoleh
tiga variabel independen yang mempengaruhi PDRB yaitu variabel jumlah ternak yang
keluar, jumlah unit usaha kecil menengah dan variabel jumlah penduduk.
Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi C)
Y = a + b X1 + b X2 + ….+ e
Y = 1494078 + 5,276968 X1 + 3844,075 X2 + 199,9362 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha kecil menengah
X3 = jumlah ternak keluar
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Entered, yang menunjukkan variabel independen yang mempengaruhi variabel dependen.
Pada regresi menggunakan robust, uji post estimasi hettest tidak perlu digunakan
karena dengan robust sudah menghilangkan heteroskedasticity tersebut.
Tabel pada Gambar 22 menunjukkan nilai VIF yang dihasilkan oleh masing-masing
variabel. Pada kasus ini, tidak terdapat multikolinearity karena ketiga variabel tersebut
tidak memiliki nilai VIF yang berbeda secara signifikan dengan nilai VIF variabel
lainnya.
22
Gambar 23. Uji Normalitas Residu
Command: pnorm ec
Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.
23
1.00e+07 2.00e+07
Residuals
0
-1.00e+07
-2.00e+07
Command: qnorm ec
Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).
24
2) Prosedur Stepwise Backward atau Variables Removed Robust
Bagian ini menjelaskan step yang dilakukan, dimulai dengan model penuh (dengan
variabel independen yang diinput). Lalu variabel satu persatu di keluarkan (removed).
Variabel yang dikeluarkan dari model regresi adalah variabel dengan nilai P>|t| lebih dari
sama dengan 0.05 (level signifikansi).
Tabel pada Gambar 27 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.
25
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Berdasarkan analisis Stata dengan metode Stepwise yang di Robust, diperoleh
tiga variabel independen yang mempengaruhi PDRB yaitu variabel jumlah ternak yang
keluar, jumlah unit usaha besar dan variabel jumlah penduduk.
Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi D)
Y = a + b X1 + b X2 + ….+ e
Y = 2258910 +4,155299 X1 + 722198,4 X2 + 213,3486 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha besar
X3 = jumlah ternak keluar
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Model yang dihasilkan metode ini sama dengan model sebelumnya (forward)
karena menggunakan level signifikansi yang sama.
Pada regresi menggunakan robust, uji post estimasi hettest tidak perlu digunakan
karena dengan robust suda menghilangkan heteroskedasticity tersebut.
Tabel pada Gambar 28 menunjukkan nilai VIF yang dihasilkan oleh masing-masing
variabel. Pada kasus ini, tidak terdapat multikolinearity karena kedua variabel tersebut
tidak memiliki nilai VIF yang berbeda secara signifikan dengan nilai VIF variabel
lainnya.
26
2.0e-08 4.0e-08 6.0e-08 8.0e-08 1.0e-07
Density
0
Command: pnorm ed
Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.
27
1.00e+07 2.00e+07
Residuals
0
-1.00e+07
-2.00e+07
Command: qnorm ed
Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).
28
IV.4 Menganalisis dan Menginterpretasikan Hasil Analisis
• Berdasarkan analisis regresi yang telah dilakukan, hasil model regresi yang digunakan
adalah regresi stepwise removed menggunakan robust. Karena dengan menggunakan analisis
regresi stepwise, variabel yang dipertimbangkan dalam model merupakan variabel
independen yang signifikan dalam menjelaskan variabel dependen (PDRB) serta tidak
terdapat variabel yang memiliki multikolinearity (berdasarkan nilai VIF). Melalui analisis
regresi dengan robust, tidak terdapatnya heteroskedasticity yang sebelumnya terjadi pada
regresi stepwise tanpa robust.
Stepwise Stepwise
Stepwise Stepwise
Default Entered Removed
Entered Removed
(robust) (robust)
Var Ind Semua 2 2 3 3
Prob > F 0.0002 0.0000 0.0000 0.0000 0.0000
R-squared 0.7999 0.6898 0.6898
Adj 0.7159 0.7379
0.6999 0.6616 0.6616
R-squared
Hettest (Prob >
0.4649 0.0008 0.0008 - -
chi2)
Tidak
Hettest Ada Ada Tidak Ada Tidak Ada
Ada
Mean VIF 5.46 1.05 1.05 1.36 1.55
Multikolinearity Ada Tidak Tidak Tidak Tidak
• Berdasarkan hasil analisis regresi stepwise removed dengan robust, variabel yang dapat
menjelaskan PDRB dengan baik adalah variabel jumlah penduduk, variabel jumlah unit
usaha besar dan variabel jumlah ternak keluar. Dapat dilihat dari nilai P >|𝑡| masing-
masing variabel tersebut lebih kecil dari 0.05 yang berarti variabel tersebut signifikan
terhadap variabel dependen (PDRB)
29
• Model regresi yang terbentuk adalah
Y = a + b X1 + b X2 + ….+ e
Y = 2258910 +4,155299 X1 + 722198,4 X2 + 213,3486 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha besar
X3 = jumlah ternak keluar
Jadi, variabel dependen PDRB dipengaruhi oleh tiga variabel prediktor (dari 8 variabel yang
dimasukkan) yaitu variabel jumlah penduduk, jumlah unit usaha besar, dan jumlah ternak
yang keluar. Berdasarkan model di atas dapat disimpulkan pola yang terbentuk adalah
semakin tinggi jumlah penduduk, jumlah unit usaha besar dan jumlah ternak yang keluar;
maka semakin tinggi pula nilai PDRB Provinsi Jawa Barat pada tahun 2006. Sebaliknya,
jika jumlah penduduk, jumlah unit usaha besar dan jumlah ternak yang keluar semakin
berkurang, maka nilai variabel jumlah PDRB Provinsi Jawa Barat tahun 2006 juga akan ikut
turun. Adapun penjelasan tiap variabel independen dengan PDRB sebagai berikut:
- Setiap penambahan 1% jumlah ternak yang keluar akan menambah jumlah PDRB
sebanyak 213,348 %.
- Setiap penambahan 1% jumlah penduduk akan meningkatkan jumlah PDRB sebanyak
4,155%.
- Setiap penambahan 1% jumlah unit usaha besar akan meningkatkan jumlah PDRB
sebanyak 722198,4 %.
• Validasi model regresi ini dapat dilihat dari nilai R-Squared, yakni sebesar 73,79 %. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variabel
dependen sebesar 73,79%.
Adapun signifikansi dari model regresi yang terbentuk adalah Nilai Prob > F 0,000. Karena
nilai Prob > F lebih kecil dari 0,05, hal ini menunjukkan model yang dihasilkan valid dan
dapat merepresentasikan dunia nyata atau memiliki keberartian.
• Jika jumlah ternak yang keluar dari Provinsi Jawa Barat sebanyak 100.000, jumlah
penduduknya 10.000.000 jiwa jumlah penduduk dan jumlah unit usaha besar 100
PDRB’ = PDRB + e
= 137.366.600 + 1346308
= 138.712.908
30
Pustaka
Healey, J. 1997. Statistics: A Tool for Social Research. Wadsworth Publishing Company:
Washington.
Makridakis, S. et al. 1983. Forecasting: Methods & Apllications. John Willey & Son: New York.
Sawitri, Dewi. Maryati, Sri. 2014. Metode Analisis Perencanaan. Penerbit Universitas Terbuka:
Tangerang
31