Anda di halaman 1dari 31

MODUL III

ANALISIS PERAMALAN KAUSAL (REGRESI BERGANDA)

I. TUJUAN
1. Praktikan mampu memahami konsep-konsep dan prinsip dasar pada analisis peramalan
kausal (regresi berganda)
2. Praktikan mampu menjalankan prosedur analisis peramalan kausal dengan Aplikasi Stata.
3. Praktikan mampu melakukan interpretasi hasil analisis peramalan kausal (regresi
berganda) dalam konteks PWK.

II. ALAT DAN BAHAN


Alat:
1. Komputer dan Perangkatnya
2. Aplikasi Stata
Data:
1. Data Hasil Survey Sekunder

III. TEORI DASAR


Metode peramalan kausal (regresi berganda) adalah metode analisis untuk meramalkan nilai suatu
variabel berdasarkan pola hubungan variabel tersebut dengan variabel lainnya yang
mempengaruhi. Oleh karena metode peramalan ini didasarkan pada pola hubungan antarvariabel,
maka bentuk hubungan variabel yang diramalkan dengan variabel yang diduga mempengaruhi
merupakan hal krusial dalam metode analisis ini.

Dalam peramalan kausal, terdapat sejumlah asumsi yang digunakan. Asumsi-asumsi yang
digunakan adalah sebagai berikut ini.
• Variabel yang akan diramal menunjukkan suatu hubungan sebab akibat dengan satu atau lebih
variabel yang lain.
• Bersifat kuantitatif dan terdapat hubungan sebab akibat. Variabel yang digunakan terdiri dari
variabel bebas dan terikat, bentuk hubungan fungsional dapat berupa time series maupun cross
section.
• Memenuhi asumsi model regresi. Secara khusus, dalam model regresi terdapat sejumlah asumsi
seperti berikut ini.
o Setiap nilai variabel prediktor X ada suatu distribusi probabilitas dari nilai-nilai kriteria
Y. Untuk setiap distribusi Y, satu atau lebih diambil sampel secara random,
o Variansi distribusi Y semuanya sama satu dengan yang lain (homosedasticity).
o Rata-rata distribusi Y jatuh pada garis regresi Y=+βX, dimana Y adalah rata-rata
distribusi Y untuk nilai X tertentu, β adalah kelerengan garis regresi,  perpotongan
garis regresi dengan sumbu Y.

1
• Memenuhi kriteria estimasi hubungan, yaitu kriteria least square.
• Memenuhi keakuratan model, yang terdiri dari kesalahan baku dan proporsi variansi yang
dijelaskan model.
• Memenuhi keberartian persamaan regresi.

Secara umum, analisis regresi terbagi menjadi analisis regresi sederhana dan analisis regresi
berganda. Persamaan regresi sederhana dapat dinyatakan dalam persamaan Y=a+bX. Sedangkan
regresi berganda merupakan perluasan dari regresi sederhana. Regresi berganda menyatakan
hubungan antara satu variabel dependen dengan satu atau lebih variabel independen. Persamaan
regresi berganda dapat dinyatakan seperti berikut:

Y’=a+b1X1+b2X2+ ........................... +bkXk,

dengan Y’ adalah nilai prediksi dari variabel; a, b merupakan koefisien yang ditentukan
berdasarkan data sampel; dan X1, X2……,Xk merupakan variabel prediktor.

Tahapan penting dalam analisis regresi adalah seleksi variabel prediktor. Prosedur dalam seleksi
variabel prediktor adalah sebagai berikut.
• Membuat daftar panjang variabel prediktor. Variabel prediktor atau independen dapat diperoleh
dari teori dan logika hasil studi literatur, serta arahan pakar.
• Membuat daftar pendek variabel prediktor. Persamaan regresi hendaknya mempunyai variabel
prediktor sesedikit mungkin sehingga variabel prediktor yang tidak terlalu berperan harus
dihapus.

Seleksi variabel prediktor dapat dilakukan dalam berbagai cara, antara lain adalah plot variabel
bebas terhadap variabel terikat, hitung inter-korelasi, analisis faktor melalui prosedur lain
diantaranya “stepwise”. Prosedur stepwise terdiri dari prosedur forward dan prosedur backward.
a. Backward Elimination
Metode ini dimulai dengan memasukkan semua variabel terlebih dahulu, kemudian
dilakukan analisis. Variabel yang tidak layak masuk dalam regresi akan dikeluarkan
satu per satu.
b. Forward Elimination
Metode ini dilakukan dengan memasukkan variabel independen satu per satu.

Multikolineariti

Dalam regresi terdapat permasalahan multicollinierarity. Multikolineariti adalah suatu masalah


perhitungan yang muncul jika kondisi-kondisi seperti ini terjadi karena: (1) dua variabel bebas
berkorelasi sempurna; (2) dua variabel bebas hampir berkorelasi sempurna; (3) kombinasi linear
dari beberapa variabel bebas berkorelasi sempurna dengan variabel bebas lainnya; (4) kombinasi
linear dari suatu sub-himpunan variabel bebas berkorelasi sempurna atau mendekati sempurna
dengan suatu kombinasi linear dari sub-himpunan variabel bebas lainnya.

2
Multikolineariti harus dihindari dengan alasan berikut.
• Bila multicollinierarity terjadi dalam model regresi berganda, solusi least square tidak mungkin
dihasilkan. Hal ini disebabkan karena solusi least square dipengaruhi oleh error yang
berlebihan.
• Kestabilan model regresi berganda dipengaruhi oleh multicollinierarity. Standart error
koefisien dipengaruhi oleh korelasi variabel bebas, semakin besar korelasi, dan koefisien
semakin tidak stabil.
• Dapat mempengaruhi hasil peramalan, yaitu hasil peramalan menjadiover estimate.

Multikolineariti dapat dihindari dengan beberapa alternatif cara yang diantaranya adalah sebagai
berikut.
• Menyisihkan atau membuang data ekstrim dalam suatu variabel.
• Memperbesar ukuran sampel.
• Memasukan persamaan tambahan atau data baru ke dalam model.
• Menghubungkan data cross section dan data time series.
• Membuang salah satu atau beberapa variabel yang berkorelasi tinggi.
• Mentransformasikan variabel.
• Melakukan teknik pemodelan yang lebih kompleks terlebih dahulu seperti analisis faktor
sehingga variabel-variabel yang menyebabkan multikolineariti akan difiltrasi terlebih dahulu.

Dummy Variable

Dalam membuat persamaan regresi, variabel independen yang bersifat kualitatif (data nominal atau
ordinal) tetap dapat digunakan. Hanya saja data yang bersifat kualitatif tidak dapat digunakan
secara langsung. Variabel tersebut harus diubah menjadi variabel dummy. Variabel dummy
dinyatakan dalam nilai 1 dan 0, nilai 1 untuk nilai yang diinginkan, dan nilai 0 untuk nilai yang
tidak diinginkan. Suatu variabel dummy equivalen dengan variabel regresor baru. Bila digunakan
variabel kualitatif dengan n kriteria, maka gunakan n variabel dummy untuk menunjukkan n
kriteria yang berbeda.

IV. PENGOLAHAN DATA DAN ANALISIS


Pada pratikum kali ini akan digunakan data Provinsi Jawa Barat pada tahun 2006. Provinsi Jawa
Barat memiliki 25 kabupaten dan kota. Variabel-variabel yang digunakan adalah:

- Nama Kabupaten/Kota
- Jumlah penduduk
- Jumlah produksi padi
- Jumlah ternak yang keluar
- Jumlah tenaga kerja industri kecil menengah
- Jumlah tenaga kerja industri besar
- Jumlah unit usaha industri kecil menengah
- Jumlah unit usaha industri besar

3
- Jumlah hotel dan akomodasi
- PDRB

Dari 10 variabel diatas, jumlah PDRB tahun 2006 merupakan variabel dependen sedangkan
variabel lainnya digunakan sebagai variabel prediktor. Untuk mengetahui apa saja variabel yang
mempengaruhi jumlah PDRB pada tahun 2006 di Provinsi Jawa Barat, maka digunakan analisis
regresi berganda. Metode yang digunakan dalam analisis regresi berganda kali ini adalah metode
Stepwise. Secara umum, cara kerja dari metode tersebut adalah dengan memasukkan variabel
bebas satu per satu dan variabel yang tidak memiliki korelasi dengan variabel dependen dapat
dikeluarkan.

Adapun tujuan dari pengolahan data tersebut adalah untuk membuat model regresi yang
mengestimasikan besaran PDRB, berdasarkan variabel-variabel lainnya yang memiliki hubungan
dengan variabel PDRB.

Tabel 1. Input Data

Jml Jml Jml


Jml
Jml Jml Tenaga Tenaga Unit
Kabupaten/ Jml Unit Jml Hotel
Produksi Ternak Kerja Kerja Usaha PDRB
Kota Penduduk Usaha Akomodasi
Padi Klr (income (income nd
nd bsr
menengah) besar) kclmngh
kabupaten
1 4.100.934 411.511 17.304 1.026 41 3.346 26 117 38.182.120
bogor
2 sukabumi 2.224.993 677.328 82.773 1.233 85 600 1 95 11.324.257
3 cianjur 2.098.644 686.619 8.699 423 45 - - 103 10.776.519
kabupaten
4 4.263.934 604.540 13.164 531 80 291 5 47 25.494.164
bandung
5 garut 2.321.070 617.922 3.864 1.055 81 129 8 93 13.697.884
kabupaten
6 1.693.479 645.065 - 13 2 - - 8 7.253.242
tasikmalaya
7 ciamis 1.542.661 552.347 3.334 10 2 - - 218 9.247.507
8 kuningan 1.096.848 331.802 11.863 10 3 - - 42 4.573.373
kabupaten
9 2.107.918 430.794 531 573 23 170 3 13 9.760.061
cirebon
10 majalengka 1.191.490 531.572 105 69 8 - - 9 5129025.5
11 sumedang 1.067.361 383.070 469 1.692 3 150 1 19 7.048.211
12 indramayu 1.760.286 1.1e+06 35.604 - - - - 22 23.591.254
13 subang 1.421.973 962.898 20.743 5 1 - - 76 9.063.475
14 purwakarta 770.660 176.960 1.441 230 11 244 3 19 8.531.292
15 karawang 1.985.574 919.843 - 95 5 662 5 22 25.804.278
kabupaten
16 1.953.380 529.093 157.852 242 4 57.017.160
bekasi 988 6 8
17 kota bogor 844.778 9.219 - 36 3 687 4 49 5.391.919

4
Jml Jml Jml
Jml
Jml Jml Tenaga Tenaga Unit
Kabupaten/ Jml Unit Jml Hotel
Produksi Ternak Kerja Kerja Usaha PDRB
Kota Penduduk Usaha Akomodasi
Padi Klr (income (income nd
nd bsr
menengah) besar) kclmngh
18 sukabumi 287.760 22.844 9.380 249 19 - - 32 2402017.5
kota
19 2.315.895 24.529 8.999 1.324 99 129 3 253 34.792.184
bandung
kota
20 281.089 3.496 - 57 7 - - 44 6.840.256
cirebon
21 kota bekasi 1.994.850 10.406 12.222 232 15 139 3 16 19.226.332
22 depok 1.373.860 7.668 469 56 7 102 1 5 7.541.666
23 cimahi 493.693 2.930 - - - - - 3 7227777.5
kota
24 594.158 73.773 939 32 6 - - 32 4.617.522
tasikmalaya
25 banjar 173.576 33.030 - 205 25 - - 8 973962.75
Sumber: Badan Pusat Statistik, 2006

Berdasarkan studi kasus tersebut, maka penyelesaian yang dapat dilakukan terdiri dari beberapa
tahapan yang diantaranya adalah: (1) merumuskan masalah; (2) memasukkan data pada Stata, (3)
mengolah data menggunakan Stata; (4) menganalisis dan menginterpretasikan hasil analisis

IV.1 Merumuskan Masalah


Masalah yang akan diteliti adalah sebagai berikut.
• Model regresi mana yang tepat untuk menjelaskan PDRB di Jawa Barat? Jelaskan
alasannya!
• Variabel-variabel apa saja yang paling baik untuk menjelaskan PDRB di Jawa Barat?
• Bagaimana interpretasi dari model regresi yang terbentuk? (pola dan arah hubungan antara
PDRB dengan variabel-variabel yang memengaruhinya)
• Bagaimana validitas dan signifkansi dari model yang terbentuk?
• Perkirakan PDRB suatu kota di Jawa Barat dengan jumlah ternak yang keluar dari Provinsi
Jawa Barat sebanyak 100 ribu, jumlah penduduknya 10 juta jiwa jumlah penduduk dan
jumlah unit usaha besar 100 (Tingkat kepercayaan 95% dan Standar Error = 1346308)

5
IV.2 Memasukkan Data pada Stata
Klik “Data Editor” pada toolbar. Input data yang dimasukkan adalah data terkait PDRB di
Provinsi Jawa Barat seperti yang tercantum pada Gambar 1.

Gambar 1. Tampilan Data Editor

Sumber: Hasil analisis, 2019

IV.3 Mengolah Data Menggunakan Stata


Sebelum melakukan analisis, dilakukan pengelompokkan variabel menjadi suatu
kelompok terlebih dahulu untuk mempermudah analisis yang dilakukan. Pengelompokkan
variabel menjadi analisis faktor ini dilakukan dengan cara:
a. Mengelompokkan Sekelompok Variabel independen menjadi Kelompok ‘independen’
Command: global independen jml_pnddk-htl_akomodasi
Dalam praktikum ini, sekelompok variabel yang diuji diberi nama ‘independen’.
b. Mengelompokkan PDRB menjadi kelompok ‘dependen’
Command: global dependen PDRB
c. Mengelompokkan Kabupaten/Kota menjadi
kelompok ‘id’ Command: global id kab_kota

6
Adapun command yang dilakukan dalam melakukan proses analisis regresi berganda
dengan menggunakan Stata adalah sebagai berikut.

A. Descriptive Statistics

Command: summarize

Gambar 2. Tabel Descriptive Statistics

Tabel pada Gambar 2 di atas menunjukkan variabel-variabel yang akan dianalisis. Obs
merupakan jumlah objek yaitu kabupaten atau kota yang terdapat di Provinsi Jawa Barat.
Variabel PDRB merupakan variabel dependen sedangkan variabel bebas terdiri dari:
(1) jumlah penduduk;
(2) jumlah produksi padi;
(3) jumlah ternak yang keluar;
(4) jumlah tenaga kerja industri kecil menengah;
(5) jumlah tenaga kerja industri besar;
(6) jumlah unit usaha industri kecil menengah;
(7) jumlah unit usaha industri besar; dan
(8) jumlah hotel serta akomodasi.

Dari descriptive statistics tersebut, perlu dilihat apakah terdapat missing value. Tabel
descriptive statistics ini diperuntukkan untuk melihat gambaran karakteristik data yang
dimiliki, dalam hal ini rata-rata dan standar deviasi dari masing-masing variabelnya.

7
B. Correlations
Command: corr $dependen $independen

Gambar 3. Correlations

Tabel pada Gambar 3 menjelaskan korelasi masing-masing variabel dengan variabel


lainnya. Pada baris diagonal terdapat angka 1,000, hal ini berarti korelasi antarvariabel dengan
dirinya sendiri sangat kuat. Jika nilai korelasi > 0,5 maka hubungannya cukup kuat, sedangkan
bila < 0,5 hubungannya lemah. Apabila terdapat dua variabel independen dengan korelasi sangat
kuat, maka perlu berhati-hati karena dapat menimbulkan fenomena multikolinearitas. Akan
lebih baik apabila hanya salah satu variabel yang digunakan.

Tabel tersebut juga menunjukkan korelasi antar variabel, baik itu antara variabel dependen
dengan variabel independen dan juga antar variabel independennya. Variabel dependen (PDRB)
memiliki korelasi paling besar dengan variabel jumlah penduduk yaitu sebesar 0,635 dan
dengan jumlah ternak yang keluar yaitu 0,661. Berdasarkan korelasi ini ada kemungkinan kedua
variabel independen dapat menjelaskan variabel dependen (PDRB). Akan tetapi hal tersebut
harus diperkuat melalui pengujian selanjutnya.

Berdasarkan tabel tersebut dapat dilihat bahwa adanya korelasi yang kuat antar variabel
independen yaitu variabel jumlah unit usaha menengah kecil dan jumlah unit usaha besar
dengan koefisien korelasi 0,94. Tingginya korelasi tersebut dapat mengindikasikan adanya
multikolineariti antara kedua variabel tersebut. Konsekuensinya adalah hanya salah satu
variabel saja yang boleh diambil dalam model.

8
C. Prosedur Regresi Seluruh Variabel

1) Regresi Seluruh Variabel (8 Variabel)

Prosedur default stata adalah prosedur forward, tanpa persyaratan nilai


signifikansi. Sehingga seluruh variabel dimasukan kedalam model regresi.

Command: regress $dependen $independen

Gambar 4. Variables Entered

Tabel pada Gambar 4 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,002; yaitu < 0,05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,699 atau 69,99%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 69,9%. 30,1% sisanya dijelaskan oleh variabel lain diluar
model/ variabel lain diluar variabel yang masuk ke dalam model regresi.

Tabel kedua merupakan tabel model regresi tanpa menggunakan prosedur stepwise.
Sehingga seluruh variabel independen yang diinput menjadi variabel prediktor besar

9
PDRB, tanpa memerhatikan tingkat signifikasi masing-masing variabel independen
terhadap variabel dependen.

Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi A)

Y = a + b X1 + b X2 + ….+ e
Y = 1308508 + 6,12701 X1 – 5,4717 X2 + 269,6197 X3 – 112,2583 X4 –
135635,2 X5 – 12413,06 X6 + 2064915 X7 + 42709,48 X8

X1 = jumlah penduduk
X2 = jumlah produksi padi
X3 = jumlah ternak yang keluar
X4 = jumlah tenaga kerja industri kecil menengah
X5 = jumlah tenaga kerja industri besar
X6 = jumlah unit usaha industri kecil menengah
X7 = jumlah unit usaha industri besar
X8 = jumlah hotel serta akomodasi

2) Post-Estimation Model Regresi A

Gambar 5. Test Heteroskedasticity

Command: estat hettest

Asumsi model regresi, variansi distribusi variabel dependen semuanya sama satu
dengan yang lain (Homosedasticity). Hipotesis nol, menyatakan bahwa variansi konstan
(homo). Hal tersebut dapat dilihat dari nilai-p, apabila kurang dari 0,05 artinya hipotesa
nol ditolak, artinya terdapat heteroskedasticity. Pada kasus ini, p bernilai 0,4649 artinya
tidak terdapat heteroskedasticity.

10
Gambar 6. Test VIF

Command: estat vif

Tabel pada Gambar 6 menunjukkan nilai VIF yang dihasilkan oleh masing-masing
variabel. Pada kasus ini, terdapat multikolinearitas yakni variabel jumlah unit usaha besar
dan variabel jumlah unit usaha kecil menengah. Karena kedua variabel tersebut memiliki
nilai VIF yang berbeda signifikan dengan nilai VIF variabel lainnya.

Gambar 7. Uji Normalitas Residu

Command: predict ea, residual

histogram ea, kdensity norm

11
Grafik menunjukkan hasil uji normalitas dari residual.

Gambar 8. Normal P Plot

Command: pnorm ea

Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot dengan
garis semakin kecil, artinya model regresi semakin baik.
5000000 1.00e+07 1.50e+07
Residuals
0 -1.00e+07-5000000

Gambar 9. Normal Q Plot

12
Command: qnorm ea

Grafik menunjukkan persebaran data residu observasi terhadap inverse normal.


Apabila jarak plot dengan garis semakin kecil, artinya model regresi semakin baik.

6.0e+07
4.0e+07
PDRB
2.0e+07
0

1.00e+07 2.00e+07 3.00e+07 4.00e+07 5.00e+07


Fitted values

Gambar 10. Scatter Plot Hasil Regresi

Command: predict PDRB_predicta

scatter PDRB PDRB_predicta

Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).

13
3) Regresi 7 variabel

Berdasarkan prosedur regresi seluruh variabel yang dilakukan sebelumnya,


diindikasikan terdapat multikorelasi antara variabel jumlah usaha besar dan usaha kecil
menengah. Maka dari itu perlu dihapuskan salah satu variabelnya. Pada kasus ini
dihapus variael jumlah usaha kecil:

Command: regress PDRB jml_htl_akomodasi jml_unt_ush_nd_bsr


jml_tngkrj_inc_bsr jml_tngkrj_inc_kclm ngh jml_trnk_klr jml_prod_padi jml_pnddk

Gambar 11. Variables Entered

Pada tabel di Gambar 11 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,002; yaitu < 0,05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,67 atau 67,46%. Berarti berdasarkan
model tersebut, variabel independen yang ada mampu menjelaskan variansi variabel
dependen sebesar 67,46%

14
Tabel kedua merupakan tabel model regresi tanpa menggunakan prosedur stepwise.
Sehingga seluruh variabel independen yang diinput menjadi variabel prediktor besar
PDRB, dengan koefisien dapat dilihat pada tabel. Sehingga dapat dibentuk model
persamaan regresi.

Berdasarkan nilai Coef. maka diperoleh model sebagai berikut.

Y = a + b X1 + b X2 + ….+ e
Y = 1359116 + 6,382078 X1 – 5.007644 X2 + 227.3328 X3 – 798.0117 X4 –
86476.28 X5 – 530636.4 X6 + 35116.52 X7

X1 = jumlah penduduk
X2 = jumlah produksi padi
X3 = jumlah ternak yang keluar
X4 = jumlah tenaga kerja industri kecil menengah
X5 = jumlah tenaga kerja industri besar
X6 = jumlah unit usaha industri besar
X7 = jumlah hotel serta akomodasi

Gambar 12. Test VIF

Command: estat vif

Tabel pada Gambar 12 menunjukkan nilai VIF yang dihasilkan oleh masing-
masing variabel. Nilai VIF seluruh variabel berada dibawah 5. Yang berarti setelah
variabel jumlah usaha kecil menengah dibuang, tidak terdapat multikolinearitas pada data
tersebut.

Jika dibandingkan dengan regresi semua variabel, terdapat kesamaan nilai


signifikasi antara regresi seluruh variabel dengan 7 variabel. Berdasarkan nilai
determinasinya, lebih besar nilai determinasi regresi semua variabel (69,99%)
dibandingkan 7 variabel (67,46%). Akan tetapi tidak berarti regresi seluruh variabel dapat

15
digunakan, karena masih terdapat multikolinearitas pada data regresi seluruh variabel
yang menyebabkan model regresi kurang tepat. Selanjutnya dapat dilakukan prosedur
post estimation regresi seperti yang telah dilakukan sebelumnya.

D. Prosedur Regresi dengan Stepwise


1) Prosedur Regresi dengan Stepwise Forward atau Variables Entered
Prosedur forward digunakan untuk seleksi variabel dengan cara menambahkan
variabel satu per satu (dengan mensyaratkan level signifikansi variabel saat dimasukkan
ke dalam analisis regresi).
Command: stepwise, pe(0.05) : regress $dependen $independen

Gambar 13. Variables Entered Sig(0.05)

Bagian ini menjelaskan step yang dilakukan, dimulai dengan model kosong. Lalu
variabel satu persatu di masukkan (entered). Variabel yang diperkenankan masuk
kedalam model adalah variabel dengan nilai P>|t| kurang dari 0.05 (level signifikansi).

Tabel pada Gambar terdapat 13 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,6616 atau 66,16%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 66,16%

16
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Entered, yang menunjukkan variabel independen yang mempengaruhi variabel dependen.
Berdasarkan analisis Stata dengan metode Stepwise, diperoleh dua variabel independen
yang mempengaruhi PDRB yaitu variabel jumlah ternak yang keluar dan variabel jumlah
penduduk.

Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi b)

Y = a + b X1 + b X2 + ….+ e
Y = 302669,4 + 211,571 X1 + 6,644 X2
X1 = jumlah ternak yang keluar
X2 = jumlah penduduk

2) Prosedur Stepwise Backward atau Variables Removed


Prosedur backward digunakan untuk seleksi variabel dengan cara menghilangkan
variabel satu per satu (dengan mensyaratkan level signifikansi variabel saat dikeluarkan
ke dalam analisis regresi). Artinya prosedur ini dimulai dengan seluruh variabel
independen yang diinput sebagai prediktor.

Gambar 14. Variables Removed Sig(0.05)

Bagian ini menjelaskan step yang dilakukan, dimulai dengan model penuh (dengan
variabel independen yang diinput). Lalu variabel satu persatu di keluarkan (removed).
Variabel yang dikeluarkan dari model regresi adalah variabel dengan nilai P>|t| lebih dari
sama dengan 0.05 (level signifikansi).

17
Tabel pada Gambar 14 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,6616 atau 66,16%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 66,16%

Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Model yang dihasilkan metode ini sama dengan model sebelumnya (forward)
karena menggunakan level signifikansi yang sama.

3) Post-Estimation Model Regresi B

Gambar 15. Test Heteroskedasticity

Asumsi model regresi, variansi distribusi variabel dependen semuanya sama satu
dengan yang lain (Homosedasticity). Hipotesis nol, menyatakan bahwa variansi konstan
(homo). Hal tersebut dapat dilihat dari nilai-p, apabila kurang dari 0,05 artinya hipotesa
nol ditolak, artinya terdapat heteroskedasticity. Pada kasus ini, p bernilai 0,0008 artinya
terdapat heteroskedasticity. Karena terdapat heteroskedasticity, perlu dilakukan analisis
regresi menggunakan robust untuk menghilangkan data outlier yang menyebabkan
terjadinya penyimpangan asumsi.

Gambar 16. Test VIF

18
Tabel pada Gambar 16 menunjukkan nilai VIF yang dihasilkan oleh masing-
masing variabel. Pada kasus ini, tidak terdapat multikolinearity karena kedua variabel
tersebut tidak memiliki nilai VIF yang berbeda secara signifikan dengan nilai VIF
variabel lainnya.

Gambar 17. Uji Normalitas Residu

Command: predict eb, residual

histogram eb, kdensity norm

Grafik menunjukkan hasil uji normalitas dari residual.

Gambar 18. Normal P Plot

Command: pnorm eb

19
Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.

Gambar 19. Normal Q Plot

Command: qnorm eb

Grafik menunjukkan persebaran data residu observasi terhadap inverse normal.


Apabila jarak plot dengan garis semakin kecil, artinya model regresi semakin baik.

Gambar 20. Scatter Plot Hasil Regresi

Command: predict PDRB_predictb

scatter PDRB PDRB_predictb

Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).
20
E. Prosedur Stepwise menggunakan Robust
Untuk menghilangkan kasus heteroskedasticity yang terdapat pada regresi stepwise,
dapat dilakukan analisis regresi menggunakan robust yaitu dengan terjelaskannya standar
error dan membuang outlier data yang menyebabkan kasus heteroskedasticity terjadi.

1) Prosedur Regresi dengan Stepwise Forward atau Variables Entered Robust

Command: stepwise, pe(0.05): regress $dependen $independen, robust

Gambar 21. Variables Entered (0.05)

Bagian ini menjelaskan step yang dilakukan, dimulai dengan model kosong. Lalu
variabel satu persatu di masukkan (entered). Variabel yang dikeluarkan dari model regresi
adalah variabel dengan nilai P>|t| lebih dari sama dengan 0.05 (level signifikansi).

Tabel pada Gambar 21 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0.000, maka <0.05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Pada model ini, nilai R-Squared adalah 0,7159 atau 71,59%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 71,59%.

21
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Berdasarkan analisis Stata dengan metode Stepwise yang di Robust, diperoleh
tiga variabel independen yang mempengaruhi PDRB yaitu variabel jumlah ternak yang
keluar, jumlah unit usaha kecil menengah dan variabel jumlah penduduk.

Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi C)

Y = a + b X1 + b X2 + ….+ e
Y = 1494078 + 5,276968 X1 + 3844,075 X2 + 199,9362 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha kecil menengah
X3 = jumlah ternak keluar
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Entered, yang menunjukkan variabel independen yang mempengaruhi variabel dependen.

Post-Estimation Model Regresi C

Pada regresi menggunakan robust, uji post estimasi hettest tidak perlu digunakan
karena dengan robust sudah menghilangkan heteroskedasticity tersebut.

Gambar 22. Test VIF

Tabel pada Gambar 22 menunjukkan nilai VIF yang dihasilkan oleh masing-masing
variabel. Pada kasus ini, tidak terdapat multikolinearity karena ketiga variabel tersebut
tidak memiliki nilai VIF yang berbeda secara signifikan dengan nilai VIF variabel
lainnya.

22
Gambar 23. Uji Normalitas Residu

Command: predict ec, residual

histogram ec, kdensity norm

Grafik menunjukkan hasil uji normalitas dari residual.

Gambar 24. Normal P Plot

Command: pnorm ec

Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.

23
1.00e+07 2.00e+07
Residuals
0
-1.00e+07
-2.00e+07

Gambar 25. Normal Q Plot

Command: qnorm ec

Grafik menunjukkan persebaran data residu observasi terhadap inverse normal.


Apabila jarak plot dengan garis semakin kecil, artinya model regresi semakin baik.
6.0e+07
4.0e+07
PDRB
2.0e+07
0

Gambar 26. Scatter Plot Hasil Regresi

Command: predict PDRB_predictc

scatter PDRB PDRB_predictc

Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).

24
2) Prosedur Stepwise Backward atau Variables Removed Robust

Command: Stepwise, pr(0.05): regress $dependen $independen, robust

Gambar 27. Variables Removed Sig(0.05)

Bagian ini menjelaskan step yang dilakukan, dimulai dengan model penuh (dengan
variabel independen yang diinput). Lalu variabel satu persatu di keluarkan (removed).
Variabel yang dikeluarkan dari model regresi adalah variabel dengan nilai P>|t| lebih dari
sama dengan 0.05 (level signifikansi).

Tabel pada Gambar 27 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa model yang dihasilkan valid, dimana pengaruh variabel independen terhadap
variabel dependen lebih dominan dibandingkan dengan pengarus error terhadap variabel
independen. Atau dapat pula diartikan bahwa model dapat merepresentasikan dunia nyata
atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Pada model ini, nilai R-Squared adalah 0,7379 atau 73,79%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 73,79%

25
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Berdasarkan analisis Stata dengan metode Stepwise yang di Robust, diperoleh
tiga variabel independen yang mempengaruhi PDRB yaitu variabel jumlah ternak yang
keluar, jumlah unit usaha besar dan variabel jumlah penduduk.

Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi D)

Y = a + b X1 + b X2 + ….+ e
Y = 2258910 +4,155299 X1 + 722198,4 X2 + 213,3486 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha besar
X3 = jumlah ternak keluar
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Model yang dihasilkan metode ini sama dengan model sebelumnya (forward)
karena menggunakan level signifikansi yang sama.

Post-Estimation Model Regresi D

Pada regresi menggunakan robust, uji post estimasi hettest tidak perlu digunakan
karena dengan robust suda menghilangkan heteroskedasticity tersebut.

Gambar 28. Test VIF

Tabel pada Gambar 28 menunjukkan nilai VIF yang dihasilkan oleh masing-masing
variabel. Pada kasus ini, tidak terdapat multikolinearity karena kedua variabel tersebut
tidak memiliki nilai VIF yang berbeda secara signifikan dengan nilai VIF variabel
lainnya.

26
2.0e-08 4.0e-08 6.0e-08 8.0e-08 1.0e-07
Density
0

-2.00e+07 -1.00e+07 1.00e+07 2.00e+07


Residuals

Gambar 29. Uji Normalitas Residu

Command: predict ed, residual

histogram ec, kdensity norm

Grafik menunjukkan hasil uji normalitas dari residual.


1.00 0.75
Normal F[(ec-m)/s]
0.25 0.50
0.00

0.00 0.25 0.50 0.75 1.00


Empirical P[i] = i/(N+1)

Gambar 30. Normal P Plot

Command: pnorm ed

Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.

27
1.00e+07 2.00e+07
Residuals
0
-1.00e+07
-2.00e+07

Gambar 31. Normal Q Plot

Command: qnorm ed

Grafik menunjukkan persebaran data residu observasi terhadap inverse normal.


Apabila jarak plot dengan garis semakin kecil, artinya model regresi semakin baik.
6.0e+07
4.0e+07
PDRB
2.0e+07
0

Gambar 32. Scatter Plot Hasil Regresi

Command: predict PDRB_predictd

scatter PDRB PDRB_predictd

Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).

28
IV.4 Menganalisis dan Menginterpretasikan Hasil Analisis

• Berdasarkan analisis regresi yang telah dilakukan, hasil model regresi yang digunakan
adalah regresi stepwise removed menggunakan robust. Karena dengan menggunakan analisis
regresi stepwise, variabel yang dipertimbangkan dalam model merupakan variabel
independen yang signifikan dalam menjelaskan variabel dependen (PDRB) serta tidak
terdapat variabel yang memiliki multikolinearity (berdasarkan nilai VIF). Melalui analisis
regresi dengan robust, tidak terdapatnya heteroskedasticity yang sebelumnya terjadi pada
regresi stepwise tanpa robust.
Stepwise Stepwise
Stepwise Stepwise
Default Entered Removed
Entered Removed
(robust) (robust)
Var Ind Semua 2 2 3 3
Prob > F 0.0002 0.0000 0.0000 0.0000 0.0000
R-squared 0.7999 0.6898 0.6898
Adj 0.7159 0.7379
0.6999 0.6616 0.6616
R-squared
Hettest (Prob >
0.4649 0.0008 0.0008 - -
chi2)
Tidak
Hettest Ada Ada Tidak Ada Tidak Ada
Ada
Mean VIF 5.46 1.05 1.05 1.36 1.55
Multikolinearity Ada Tidak Tidak Tidak Tidak

• Berdasarkan hasil analisis regresi stepwise removed dengan robust, variabel yang dapat
menjelaskan PDRB dengan baik adalah variabel jumlah penduduk, variabel jumlah unit
usaha besar dan variabel jumlah ternak keluar. Dapat dilihat dari nilai P >|𝑡| masing-
masing variabel tersebut lebih kecil dari 0.05 yang berarti variabel tersebut signifikan
terhadap variabel dependen (PDRB)

29
• Model regresi yang terbentuk adalah

Y = a + b X1 + b X2 + ….+ e
Y = 2258910 +4,155299 X1 + 722198,4 X2 + 213,3486 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha besar
X3 = jumlah ternak keluar
Jadi, variabel dependen PDRB dipengaruhi oleh tiga variabel prediktor (dari 8 variabel yang
dimasukkan) yaitu variabel jumlah penduduk, jumlah unit usaha besar, dan jumlah ternak
yang keluar. Berdasarkan model di atas dapat disimpulkan pola yang terbentuk adalah
semakin tinggi jumlah penduduk, jumlah unit usaha besar dan jumlah ternak yang keluar;
maka semakin tinggi pula nilai PDRB Provinsi Jawa Barat pada tahun 2006. Sebaliknya,
jika jumlah penduduk, jumlah unit usaha besar dan jumlah ternak yang keluar semakin
berkurang, maka nilai variabel jumlah PDRB Provinsi Jawa Barat tahun 2006 juga akan ikut
turun. Adapun penjelasan tiap variabel independen dengan PDRB sebagai berikut:

- Setiap penambahan 1% jumlah ternak yang keluar akan menambah jumlah PDRB
sebanyak 213,348 %.
- Setiap penambahan 1% jumlah penduduk akan meningkatkan jumlah PDRB sebanyak
4,155%.
- Setiap penambahan 1% jumlah unit usaha besar akan meningkatkan jumlah PDRB
sebanyak 722198,4 %.
• Validasi model regresi ini dapat dilihat dari nilai R-Squared, yakni sebesar 73,79 %. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variabel
dependen sebesar 73,79%.
Adapun signifikansi dari model regresi yang terbentuk adalah Nilai Prob > F 0,000. Karena
nilai Prob > F lebih kecil dari 0,05, hal ini menunjukkan model yang dihasilkan valid dan
dapat merepresentasikan dunia nyata atau memiliki keberartian.
• Jika jumlah ternak yang keluar dari Provinsi Jawa Barat sebanyak 100.000, jumlah
penduduknya 10.000.000 jiwa jumlah penduduk dan jumlah unit usaha besar 100

PDRB = 2258910 + 4,155299 X1 + 722198,4 X2 + 213,3486 X3


= 2258910 + 4,155299 (10.000.000) + 722198,4 (100) + 213,3486 (100.000)
= 137.366.600

PDRB’ = PDRB + e
= 137.366.600 + 1346308
= 138.712.908

30
Pustaka
Healey, J. 1997. Statistics: A Tool for Social Research. Wadsworth Publishing Company:
Washington.

Makridakis, S. et al. 1983. Forecasting: Methods & Apllications. John Willey & Son: New York.

Sawitri, Dewi. Maryati, Sri. 2014. Metode Analisis Perencanaan. Penerbit Universitas Terbuka:
Tangerang

31

Anda mungkin juga menyukai