Anda di halaman 1dari 27

MODUL III

ANALISIS PERAMALAN KAUSAL (REGRESI BERGANDA)

I. TUJUAN
1. Praktikan mampu memahami konsep-konsep dan prinsip dasar metode analisis peramalan
kausal.
2. Praktikan mampu menjalankan prosedur analisis peramalan kausal dengan Stata.
3. Praktikan mampu melakukan interpretasi hasil analisis regresi berganda dalam konteks
PWK.

II. ALAT DAN BAHAN


Alat:
1. Komputer dan Perangkatnya
2. Aplikasi Stata
Data:
1. Data Hasil Survey Sekunder

III. TEORI DASAR


Metode peramalan kausal adalah metode analisis untuk meramalkan nilai suatu variabel
berdasarkan pola hubungan variabel tersebut dengan variabel lainnya yang mempengaruhi. Oleh
karena metode peramalan ini didasarkan pada pola hubungan antarvariabel, maka bentuk
hubungan variabel yang diramalkan dengan variabel yang diduga mempengaruhi merupakan hal
krusial dalam metode analisis ini.

Dalam peramalan kausal, terdapat sejumlah asumsi yang digunakan. Asumsi-asumsi yang
digunakan adalah sebagai berikut ini.
 Variabel yang akan diramal menunjukkan suatu hubungan sebab akibat dengan satu atau lebih
variabel yang lain.
 Bersifat kuantitatif dan terdapathubungan sebab akibat. Variabel yang digunakan terdiri dari
variabel bebas dan terikat, bentuk hubungan fungsional dapat berupa time series maupun cross
section.
 Memenuhi asumsi model regresi.
 Memenuhi kriteria estimasi hubungan, yaitu kriteria least square.
 Memenuhi keakuratan model, yang terdiri dari kesalahan baku dan proporsi variansi yang
dijelaskan model.
 Memenuhi keberartian persamaan regresi.

Secara khusus, dalam model regresi terdapat sejumlah asumsi seperti berikut ini.
 Setiap nilai variabel prediktor X ada suatu distribusi probabilitas dari nilai-nilai kriteria Y.
Untuk setiap distribusi Y, satu atau lebih diambil sampel secara random,
 Variansi distribusi Y semuanya sama satu dengan yang lain (homosedasticity).
 Rata-rata distribusi Y jatuh pada garis regresi Y=+βX, dimana Y adalah rata-rata distribusi
Y untuk nilai X tertentu, β adalah kelerengan garis regresi,  perpotongan garis regresi dengan
sumbu Y.

Secara umum, analisis regresi terbagi menjadi analisis regresi sederhana dan analisis regresi
berganda. Persamaan regresi sederhana dapat dinyatakan dalam persamaan Y=a+bX. Sedangkan
regresi berganda merupakan perluasan dari regresi sederhana. Regresi berganda menyatakan
hubungan antara satu variabel dependen dengan satu atau lebih variabel independen. Persamaan
regresi berganda dapat dinyatakan seperti berikut:

Y’=a+b1X1+b2X2+…………………+bkXk,

dengan Y’ adalah nilai prediksi dari variabel; a, b merupakan koefisien yang ditentukan
berdasarkan data sampel; dan X1, X2……,Xk merupakan variabel prediktor.

Tahapan penting dalam analisis regresi adalah seleksi variabel prediktor. Prosedur dalam seleksi
variabel prediktor adalah sebagai berikut.
 Membuat daftar panjang variabel prediktor. Variabel prediktor atau independen dapat diperoleh
dari teori, logika, arahan pakar, ketersediaan data, kendala waktu dan biaya.
 Membuat daftar pendek variabel prediktor. Persamaan regresi hendaknya mempunyai variabel
prediktor sesedikit mungkin sehingga variabel prediktor yang tidak terlalu berperan harus
dihapus.

Seleksi variabel prediktor dapat dilakukan dalam berbagai cara, antara lain adalah plot variabel
bebas terhadap variabel terikat, hitung inter-korelasi, analisis faktor melalui prosedur lain
diantaranya “stepwise”. Prosedur stepwise terdiri dari prosedur forward dan prosedur backward.
a. Backward Elimination
Metode ini dimulai dengan memasukkan semua variabel terlebih dahulu, kemudian
dilakukan analisis. Variabel yang tidak layak masuk dalam regresi akan dikeluarkan
satu per satu.
b. Forward Elimination
Metode ini dilakukan dengan memasukkan variabel independen satu per satu.

Multikolineariti

Dalam regresi terdapat permasalahan multicollinierarity. Multikolineariti adalah suatu masalah


perhitungan yang muncul jika kondisi-kondisi seperti ini terjadi karena: (1) dua variabel bebas
berkorelasi sempurna; (2) dua variabel bebas hampir berkorelasi sempurna; (3) kombinasi linear
dari beberapa variabel bebas berkorelasi sempurna dengan variabel bebas lainnya; (4) kombinasi
linear dari suatu sub-himpunan variabel bebas berkorelasi sempurna atau mendekati sempurna
dengan suatu kombinasi linear dari sub-himpunan variabel bebas lainnya.

Multikolineariti harus dihindari dengan alasan berikut.


 Bila multicollinierarity terjadi dalam model regresi berganda, solusi least square tidak mungkin
dihasilkan. Hal ini disebabkan karena solusi least square dipengaruhi oleh error yang
berlebihan.
 Kestabilan model regresi berganda dipengaruhi oleh multicollinierarity. Standart error
koefisien dipengaruhi oleh korelasi variabel bebas, semakin besar korelasi, dan koefisien
semakin tidak stabil.
 Dapat mempengaruhi hasil peramalan, yaitu hasil peramalan menjadiover estimate.

Multikolineariti dapat dihindari dengan beberapa alternatif cara yang diantaranya adalah sebagai
berikut.
 Menyisihkan atau membuang data ekstrim dalam suatu variabel.
 Memperbesar ukuran sampel.
 Memasukan persamaan tambahan atau data baru ke dalam model.
 Menghubungkan data cross section dan data time series.
 Membuang salah satu atau beberapa variabel yang berkorelasi tinggi.
 Mentransformasikan variabel.
 Melakukan teknik pemodelan yang lebih kompleks terlebih dahulu seperti analisis faktor
sehingga variabel-variabel yang menyebabkan multikolineariti akan difiltrasi terlebih dahulu.

Dummy Variable

Dalam membuat persamaan regresi, variabel independen yang bersifat kualitatif (data nominal
atau ordinal) dapat digunakan. Hanya data yang bersifat kualitatif tidak dapat digunakan secara
langsung. Variabel tersebut harus diubah menjadi variabel dummy. Variabel dummy dinyatakan
dalam nilai 1 dan 0, nilai 1 untuk nilai yang diinginkan, dan nilai 0 untuk nilai yang tidak
diinginkan. Suatu variabel dummy equivalen dengan variabel regresor baru. Bila digunakan
variabel kualitatif dengan n kriteria, maka gunakan (p-1) variabel dummy untuk menunjukkan p
kriteria yang berbeda.

IV. PENGOLAHAN DATA DAN ANALISIS


Pada pratikum kali ini akan digunakan data Provinsi Jawa Barat pada tahun 2006. Provinsi Jawa
Barat memiliki 25 kabupaten dan kota. Variabel-variabel yang digunakan adalah:

- Kabupaten atau Kota


- Jumlah penduduk
- Jumlah produksi padi
- Jumlah ternak yang keluar
- Jumlah tenaga kerja industri kecil menengah
- Jumlah tenaga kerja industri besar
- Jumlah unit usaha industri kecil menengah
- Jumlah unit usaha industri besar
- Jumlah hotel dan akomodasi
- PDRB

Berdasarkan variabel-variabel dalam tersebut, jumlah PDRB tahun 2006 merupakan variabel
dependen sedangkan variabel lainnya digunakan sebagai variabel prediktor. Untuk mengetahui apa
saja variabel yang mempengaruhi jumlah PDRB pada tahun 2006 di Provinsi Jawa Barat, maka
digunakan analisis regresi berganda. Metode yang digunakan dalam analisis regresi berganda kali
ini adalah metode Stepwise. Secara umum, cara kerja dari metode tersebut adalah dengan
memasukkan variabel bebas satu per satu dan variabel yang tidak memiliki korelasi dengan
variabel dependen dapat dikeluarkan.

Adapun tujuan dari pengolahan data tersebut adalah untuk membuat model regresi yang
mengestimasikan besaran PDRB, berdasarkan variabel-variabel lainnya yang memiliki hubungan
antar variabel.

Tabel 1. Input Data

Jml Jml
Jml Unit Jml
Jml Jml Jml Tenaga Tenaga
Kabupaten/ Usaha Unit Jml Hotel
Pendudu Produksi Ternak Kerja Kerja PDRB
Kota nd Usaha Akomodasi
k Padi Klr (income (income
kclmngh nd bsr
menengah) besar)

kabupaten
4100934 411511 17304 1026 41 3346 26 117 38182120
1 bogor
2 sukabumi 2224993 677328 82773 1233 85 600 1 95 11324257
3 cianjur 2098644 686619 8699 423 45 0 0 103 10776519
kabupaten
4263934 604540 13164 531 80 291 5 47 25494164
4 bandung
5 garut 2321070 617922 3864 1055 81 129 8 93 13697884
kabupaten
1693479 645065 0 13 2 0 0 8 7253242
6 tasikmalaya
7 ciamis 1542661 552347 3334 10 2 0 0 218 9247507
8 kuningan 1096848 331802 11863 10 3 0 0 42 4573373
kabupaten
2107918 430794 531 573 23 170 3 13 9760061
9 cirebon
10 majalengka 1191490 531572 105 69 8 0 0 9 5129025.5
11 sumedang 1067361 383070 469 1692 3 150 1 19 7048211
12 indramayu 1760286 1.1e+06 35604 0 0 0 0 22 23591254
13 subang 1421973 962898 20743 5 1 0 0 76 9063475
14 purwakarta 770660 176960 1441 230 11 244 3 19 8531292
15 karawang 1985574 919843 0 95 5 662 5 22 25804278
Jml Jml
Jml Unit Jml
Jml Jml Jml Tenaga Tenaga
Kabupaten/ Usaha Unit Jml Hotel
Pendudu Produksi Ternak Kerja Kerja PDRB
Kota nd Usaha Akomodasi
k Padi Klr (income (income
kclmngh nd bsr
menengah) besar)

kabupaten
1953380 529093 157852 242 4 988 6 8 57017160
16 bekasi
17 kota bogor 844778 9219 0 36 3 687 4 49 5391919
18 sukabumi 287760 22844 9380 249 19 0 0 32 2402017.5
kota
2315895 24529 8999 1324 99 129 3 253 34792184
19 bandung
kota
281089 3496 0 57 7 0 0 44 6840256
20 cirebon
21 kota bekasi 1994850 10406 12222 232 15 139 3 16 19226332
22 depok 1373860 7668 469 56 7 102 1 5 7541666
23 cimahi 493693 2930 0 0 0 0 0 3 7227777.5
kota
594158 73773 939 32 6 0 0 32 4617522
24 tasikmalaya
25 banjar 173576 33030 0 205 25 0 0 8 973962.75
Sumber: Badan Pusat Statistik, 2006

Berdasarkan studi kasus tersebut, maka penyelesaian yang dapat dilakukan terdiri dari beberapa
tahapan yang diantaranya adalah: (1) merumuskan masalah; (2) memasukkan data pada Stata, (3)
mengolah data menggunakan Stata; (4) menganalisis dan menginterpretasikan hasil analisis

IV.1 Merumuskan Masalah


Masalah yang akan diteliti adalah sebagai berikut.
 Variabel-variabel apa saja yang paling baik untuk menjelaskan PDRB di Jawa Barat?
 Bagaimana interpretasi dari model regresi yang terbentuk?
 Bagaimana Anda mengkonfirmasi bahwa hasil regresi tersebut memiliki makna yang
berarti?
 Perkirakan PDRB suatu kota di Jawa Barat dengan jumlah ternak yang keluar dari Provinsi
Jawa Barat sebanyak 100 ribu, jumlah penduduknya 10 juta jiwa jumlah penduduk dan
jumlah unit usaha besar 100
IV.2 Memasukkan Data pada Stata
Klik “Data Editor” pada toolbar. Input data yang dimasukkan adalah data terkait PDRB di
Provinsi Jawa Barat seperti yang tercantum pada Error! Reference source not found..
Gambar 1. Tampilan Data Editor

Sumber: Hasil analisis, 2019

IV.3 Mengolah Data Menggunakan Stata


Sebelum melakukan analisis, dilakukan pengelompokkan variabel menjadi suatu
kelompok terlebih dahulu untuk mempermudah analisis yang dilakukan. Pengelompokkan
variabel menjadi analisis faktor ini dilakukan dengan cara:
a. Mengelompokkan Sekelompok Variabel independen menjadi Kelompok ‘independen’
Command: global independen jml_pnddk-htl_akomodasi
Dalam praktikum ini, sekelompok variabel yang diuji diberi nama ‘independen’.
b. Mengelompokkan PDRB menjadi kelompok ‘dependen’
Command: global dependen PDRB
c. Mengelompokkan Kecamatan menjadi kelompok ‘id’
Command: global id kec
Adapun command yang dilakukan dalam melakukan proses analisis regresi berganda
dengan menggunakan Stata adalah sebagai berikut.

A. Descriptive Statistics

Command: summarize

Gambar 2. Tabel Descriptive Statistics

Tabel pada Gambar 2 di atas menunjukkan variabel-variabel yang akan dianalisis. Obs
merupakan jumlah objek yaitu kabupaten atau kota yang terdapat di Provinsi Jawa Barat.
Variabel PDRB merupakan variabel dependen sedangkan variabel bebas terdiri dari:
(1) jumlah penduduk;
(2) jumlah produksi padi;
(3) jumlah ternak yang keluar;
(4) jumlah tenaga kerja industri kecil menengah;
(5) jumlah tenaga kerja industri besar;
(6) jumlah unit usaha industri kecil menengah;
(7) jumlah unit usaha industri besar; dan
(8) jumlah hotel serta akomodasi.

Dari descriptive statistics tersebut, perlu dilihat apakah terdapat missing value. Tabel
descriptive statistics ini diperuntukkan untuk melihat gambaran karakteristik data yang
dimiliki, dalam hal ini rata-rata dan standar deviasi dari masing-masing variabelnya.
B. Correlations
Command: corr $dependen $independen

Gambar 3. Correlations

Tabel pada Gambar 33 menjelaskan korelasi masing-masing variabel degan variabel lainnya.
Pada baris diagonal terdapat angka 1,000, hal ini berarti korelasi antarvariabel dengan dirinya
sendiri sangat kuat. Jika nilai korelasi > 0,5 maka hubungannya cukup kuat, sedangkan bila <
0,5 hubungannya lemah. Apabila terdapat dua variabel independen dengan korelasi sangat kuat,
maka perlu berhati-hati karena dap at menimbulkan fenomena multikolinearitas. Akan lebih
baik apabila hanya salah satu variabel yang digunakan.

Tabel tersebut juga menunjukkan korelasi antar variabel, baik itu antara variabel dependen
dengan variabel independen dan juga antar variabel independennya. Variabel dependen (PDRB)
memiliki korelasi paling besar dengan variabel jumlah penduduk yaitu sebesar 0,635 dan
dengan jumlah ternak yang keluar yaitu 0,661. Berdasarkan korelasi ini ada kemungkinan kedua
variabel independen dapat menjelaskan variabel dependen (PDRB). Akan tetapi hal tersebut
harus diperkuat melalui pengujian selanjutnya.

Berdasarkan tabel tersebut dapat dilihat bahwa adanya korelasi yang kuat antar variabel
independen yaitu variabel jumlah unit usaha menengah kecil da jumlah unit usaha besar dengan
koefisien korelasi 0,94. Tingginya korelasi tersebut dapat mengindikasikan adanya
multikolineariti antara kedua variabel tersebut. Konsekuensinya adalah hanya salah satu
variabel saja yang boleh diambil dalam model.
C. Prosedur Regresi Seluruh Variabel

1) Regresi Seluruh Variabel (8 Variabel)

Prosedur default stata adalah prosedur forward, tanpa persyaratan nilai


signifikansi. Sehingga seluruh variabel dimasukan kedalam model regresi.

Command: regress $dependen $independen

Gambar 4. Variables Entered

Tabel pada Gambar terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,002; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,699 atau 69,99%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 69,9%. Nilai R-Squared dan Adj. R-Squared juga dapat
menjelaskan berapa persen validasi model.

Tabel kedua merupakan tabel model regresi tanpa menggunakan prosedur stepwise.
Sehingga seluruh variabel independen yang diinput menjadi variabel prediktor besar
PDRB, tanpa memerhatikan tingkat signifikasi masing-masing variabel independen
terhadap variabel dependen.
Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi a)

Y = a + b X1 + b X2 + ….+ e
Y = 1308508 + 6,12701 X1 – 5,4717 X2 + 269,6197 X3 – 112,2583 X4 –
135635,2 X5 – 12413,06 X6 + 2064915 X7 + 42709,48 X8

X1 = jumlah penduduk
X2 = jumlah produksi padi
X3 = jumlah ternak yang keluar
X4 = jumlah tenaga kerja industri kecil menengah
X5 = jumlah tenaga kerja industri besar
X6 = jumlah unit usaha industri kecil menengah
X7 = jumlah unit usaha industri besar
X8 = jumlah hotel serta akomodasi

2) Post-Estimation Model Regresi A

Gambar 5. Test Heteroskedasticity

Command: estat hettest

Asumsi model regresi, variansi distribusi variabel dependen semuanya sama satu
dengan yang lain (Homosedasticity). Hipotesis nol, menyatakan bahwa variansi konstan
(homo). Hal tersebut dapat dilihat dari nilai-p, apabila kurang dari 0,05 artinya hipotesa
nol ditolak, artinya terdapat heteroskedasticity. Pada kasus ini, p bernilai 0,4649 artinya
tidak terdapat heteroskedasticity.
Gambar 6. Test VIF

Command: estat vif

Tabel pada Error! Reference source not found. 6 menunjukkan nilai VIF yang
dihasilkan oleh masing-masing variabel. Pada kasus ini, terdapat multikolinearitas yakni
variabel jumlah unit usaha besar dan variabel jumlah unit usaha kecil menengah. Karena
kedua variabel tersebut memiliki nilai VIF yang berbeda signifikan dengan nilai VIF
variabel lainnya.

Gambar 7. Uji Normalitas Residu

Command: predict ea, residual

histogram ea, kdensity norm


Grafik menunjukkan hasil uji normalitas dari residual.

Gambar 8. Normal P Plot

Command: pnorm ea

Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot dengan
garis semakin kecil, artinya model regresi semakin baik.
5000000 1.00e+07 1.50e+07
Residuals
0 -1.00e+07-5000000

-1.00e+07 -5000000 0 5000000 1.00e+07


Inverse Normal

Command: qnorm ea
Grafik menunjukkan persebaran data residu observasi terhadap inverse normal.
Apabila jarak plot dengan garis semakin kecil, artinya model regresi semakin baik.

6.0e+07
4.0e+07
PDRB
2.0e+07
0

0 1.00e+07 2.00e+07 3.00e+07 4.00e+07 5.00e+07


Fitted values

Gambar 18. Scatter Plot Hasil Regresi

Command: predict PDRB_predicta

scatter PDRB PDRB_predicta

Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).

3) Regresi 7 variabel

Berdasarkan prosedur regresi seluruh variabel yang dilakukan sebelumnya,


diindikasikan terdapat multikorelasi antara variabel jumlah usaha besar dan usaha kecil
menengah. Maka dari itu perlu dihapuskan salah satu variabelnya. Pada kasus ini
dihapus variael jumlah usaha kecil:

Command: regress PDRB jml_htl_akomodasi jml_unt_ush_nd_bsr


jml_tngkrj_inc_bsr jml_tngkrj_inc_kclm ngh jml_trnk_klr jml_prod_padi jml_pnddk
Gambar 9. Variables Entered

Pada tabel di Gambar 9 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,002; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,67 atau 67,46%. Berarti berdasarkan
model tersebut, variabel independen yang ada mampu menjelaskan variansi variabel
dependen sebesar 67,46%. Nilai R-Squared dan Adj. R-Squared juga dapat menjelaskan
berapa persen validasi model.

Tabel kedua merupakan tabel model regresi tanpa menggunakan prosedur stepwise.
Sehingga seluruh variabel independen yang diinput menjadi variabel prediktor besar
PDRB, dengan koefisien dapat dilihat pada tabel. Sehingga dapat dibentuk model
persamaan regresi.
Berdasarkan nilai Coef. maka diperoleh model sebagai berikut.

Y = a + b X1 + b X2 + ….+ e
Y = 1359116 + 6,382078 X1 – 5.007644 X2 + 227.3328 X3 – 798.0117 X4 –
86476.28 X5 – 530636.4 X6 + 35116.52 X7

X1 = jumlah penduduk
X2 = jumlah produksi padi
X3 = jumlah ternak yang keluar
X4 = jumlah tenaga kerja industri kecil menengah
X5 = jumlah tenaga kerja industri besar
X6 = jumlah unit usaha industri besar
X7 = jumlah hotel serta akomodasi

Gambar 10. Test VIF

Command: estat vif

Tabel pada Error! Reference source not found. 10 menunjukkan nilai VIF yang
dihasilkan oleh masing-masing variabel. Nilai VIF seluruh variabel berada dibawah 5.
Yang berarti setelah variabel jumlah usaha kecil menengah dibuang, tidak terdapat
multikolinearitas pada data tersebut.

Jika dibandingkan dengan regresi semua variabel, terdapat kesamaan nilai


signifikasi antara regresi seluruh variabel dengan 7 variabel. Berdasarkan nilai
determinasinya, lebih besar nilai determinasi regresi semua variabel (69,99%)
dibandingkan 7 variabel (67,46%). Akan tetapi tidak berarti regresi seluruh variabel dapat
digunakan, karena masih terdapat multikolinearitas pada data regresi seluruh variabel
yang menyebabkan model regresi kurang tepat. Selanjutnya dapat dilakukan prosedur
post estimation regresi seperti yang telah dilakukan sebelumnya.
D. Prosedur Regresi dengan Stepwise
1) Prosedur Regresi dengan Stepwise Forward atau Variables Entered
Prosedur forward digunakan untuk seleksi variabel dengan cara menambahkan
variabel satu per satu (dengan mensyaratkan level signifikansi variabel saat dimasukkan
ke dalam analisis regresi).
Command: stepwise, pe(0.05) : regress $dependen $independen

Gambar 11. Variables Entered Sig(0.05)

Bagian ini menjelaskan step yang dilakukan, dimulai dengan model kosong. Lalu
variabel satu persatu di masukkan (entered). Variabel yang diperkenankan masuk
kedalam model adalah variabel dengan nilai P>|t| kurang dari 0.05 (level signifikansi).

Tabel pada Gambar terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,6616 atau 66,16%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 66,16%. Nilai R-Squared dan Adj. R-Squared juga dapat
menjelaskan berapa persen validasi model.

Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Entered, yang menunjukkan variabel independen yang mempengaruhi variabel dependen.
Berdasarkan analisis Stata dengan metode Stepwise, diperoleh dua variabel independen
yang mempengaruhi PDRB yaitu variabel jumlah ternak yang keluar dan variabel jumlah
penduduk.

Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi b)

Y = a + b X1 + b X2 + ….+ e
Y = 302669,4 + 211,571 X1 + 6,644 X2
X1 = jumlah ternak yang keluar
X2 = jumlah penduduk

2) Prosedur Stepwise Backward atau Variables Removed


Prosedur backward digunakan untuk seleksi variabel dengan cara menghilangkan
variabel satu per satu (dengan mensyaratkan level signifikansi variabel saat dikeluarkan
ke dalam analisis regresi). Artinya prosedur ini dimulai dengan seluruh variabel
independen yang diinput sebagai prediktor.

Gambar 12. Variables Removed Sig(0.05)

Bagian ini menjelaskan step yang dilakukan, dimulai dengan model penuh (dengan
variabel independen yang diinput). Lalu variabel satu persatu di keluarkan (removed).
Variabel yang dikeluarkan dari model regresi adalah variabel dengan nilai P>|t| lebih dari
sama dengan 0.05 (level signifikansi).

Tabel pada Gambar 2 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.
Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran
proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Sedangkan nilai Adj R-Squared merupakan nilai r-squared yang telah di
koreksi. Pada model ini, nilai Adj. R-Squared adalah 0,6616 atau 66,16%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 66,16%. Nilai R-Squared dan Adj. R-Squared juga dapat
menjelaskan berapa persen validasi model.

Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Model yang dihasilkan metode ini sama dengan model sebelumnya (forward)
karena menggunakan level signifikansi yang sama.

3) Post-Estimation Model Regresi B

Gambar 13. Test Heteroskedasticity

Asumsi model regresi, variansi distribusi variabel dependen semuanya sama satu
dengan yang lain (Homosedasticity). Hipotesis nol, menyatakan bahwa variansi konstan
(homo). Hal tersebut dapat dilihat dari nilai-p, apabila kurang dari 0,05 artinya hipotesa
nol ditolak, artinya terdapat heteroskedasticity. Pada kasus ini, p bernilai 0,0008 artinya
terdapat heteroskedasticity. Karena terdapat heteroskedasticity, perlu dilakukan analisis
regresi menggunakan robust untuk menghilangkan data outlier yang menyebabkan
terjadinya penyimpangan asumsi.

Gambar 24. Test VIF

Tabel pada Error! Reference source not found.4 menunjukkan nilai VIF yang
dihasilkan oleh masing-masing variabel. Pada kasus ini, tidak terdapat multikolinearity
karena kedua variabel tersebut tidak memiliki nilai VIF yang berbeda secara signifikan
dengan nilai VIF variabel lainnya.

Gambar 15. Uji Normalitas Residu

Command: predict eb, residual

histogram eb, kdensity norm

Grafik menunjukkan hasil uji normalitas dari residual.

Gambar 16. Normal P Plot

Command: pnorm eb

Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.
Gambar 17. Normal Q Plot

Command: qnorm eb

Grafik menunjukkan persebaran data residu observasi terhadap inverse normal.


Apabila jarak plot dengan garis semakin kecil, artinya model regresi semakin baik.

Gambar 18. Scatter Plot Hasil Regresi

Command: predict PDRB_predictb

scatter PDRB PDRB_predictb

Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).
E. Prosedur Stepwise menggunakan Robust
Untuk menghilangkan kasus heteroskedasticity yang terdapat pada regresi stepwise,
dapat dilakukan analisis regresi menggunakan robust yaitu dengan terjelaskannya standar
error dan membuang outlier data yang menyebabkan kasus heteroskedasticity terjadi .
Command:
Stepwise, pr(0.05): regress $dependen $independen, robust

Gambar 19. Variables Removed Sig(0.05)

Bagian ini menjelaskan step yang dilakukan, dimulai dengan model penuh (dengan
variabel independen yang diinput). Lalu variabel satu persatu di keluarkan (removed).
Variabel yang dikeluarkan dari model regresi adalah variabel dengan nilai P>|t| lebih dari
sama dengan 0.05 (level signifikansi).

Tabel pada Gambar 9 terdapat 2 tabel, tabel atas menunjukkan tabel Anova. Nilai
signifikansi pada model (Nilai Prob > F) adalah 0,000; yaitu < 0,05, hal ini menunjukkan
bahwa berarti model dapat merepresentasikan dunia nyata atau memiliki keberartian.

Nilai R-squared merupakan koefisien determinasi. Menjelaskan besaran


proporsi/persentase variansi variabel dependen yang mampu dijelaskan oleh variabel
independen. Pada model ini, nilai R-Squared adalah 0,7379 atau 73,79%. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variansi
variabel dependen sebesar 73,79%. Nilai R-Squared dan Adj. R-Squared juga dapat
menjelaskan berapa persen validasi model.
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Berdasarkan analisis Stata dengan metode Stepwise yang di Robust, diperoleh
tiga variabel independen yang mempengaruhi PDRB yaitu variabel jumlah ternak yang
keluar, jumlah unit usaha besar dan variabel jumlah penduduk.

Berdasarkan nilai Coef. maka diperoleh model sebagai berikut. (Pada bagian
selanjutnya disebut sebagai model regresi C)

Y = a + b X1 + b X2 + ….+ e
Y = 302669,4 +4,155299 X1 + 722198,4 X2 + 213,3486 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha besar
X3 = jumlah ternak keluar
Tabel bawah merupakan tabel model regresi dengan prosedur stepwise variables
Removed, yang menunjukkan variabel independen yang mempengaruhi variabel
dependen. Model yang dihasilkan metode ini sama dengan model sebelumnya (forward)
karena menggunakan level signifikansi yang sama.

Post-Estimation Model Regresi C

Pada regresi menggunakan robust, uji post estimasi hettest tidak perlu digunakan
karena dengan robust suda menghilangkan heteroskedasticity tersebut.

Gambar 20. Test VIF

Tabel pada Error! Reference source not found.20 menunjukkan nilai VIF yang
dihasilkan oleh masing-masing variabel. Pada kasus ini, tidak terdapat multikolinearity
karena kedua variabel tersebut tidak memiliki nilai VIF yang berbeda secara signifikan
dengan nilai VIF variabel lainnya.
1.0e-07
8.0e-08
4.0e-08 6.0e-08
Density
2.0e-08
0

-2.00e+07 -1.00e+07 0 1.00e+07 2.00e+07


Residuals

Gambar 21. Uji Normalitas Residu

Command: predict ec, residual

histogram ec, kdensity norm

Grafik menunjukkan hasil uji normalitas dari residual.


1.00 0.75
Normal F[(ec-m)/s]
0.25 0.500.00

0.00 0.25 0.50 0.75 1.00


Empirical P[i] = i/(N+1)

Gambar 22. Normal P Plot

Command: pnorm ec, norm

Grafik menunjukkan persebaran data kisaran residual data. Apabila jarak plot
dengan garis semakin kecil, artinya model regresi semakin baik.
2.00e+07
1.00e+07
Residuals
0-1.00e+07
-2.00e+07

-1.00e+07 -5000000 0 5000000 1.00e+07


Inverse Normal

Gambar 23. Normal Q Plot

Command: qnorm ec

Grafik menunjukkan persebaran data residu observasi terhadap inverse normal.


Apabila jarak plot dengan garis semakin kecil, artinya model regresi semakin baik.
6.0e+07
4.0e+07
PDRB
2.0e+07
0

0 1.00e+07 2.00e+07 3.00e+07 4.00e+07 5.00e+07


Fitted values

Gambar 24. Scatter Plot Hasil Regresi

Command: predict PDRB_predictc

scatter PDRB PDRB_predictc

Grafik menunjukkan persebaran data hasil regesi dibandingkan dengan data hasil
observasi. Semakin baik apabila hasil plot membentuk garis diagonal (45 derajat).
IV.4 Menganalisis dan Menginterpretasikan Hasil Analisis

Berdasarkan analisis regresi yang telah dilakukan, hasil model regresi yang digunakan adalah
regresi stepwise menggunakan robust. Karena dengan menggunakan analisis regresi stepwise,
variabel yang dipertimbangkan dalam model merupakan variabel independen yang signifikan
dalam menjelaskan variabel dependen (PDRB) serta tidak terdapat variabel yang memiliki
multikolinearity (berdasarkan nilai VIF). Melalui analisis regresi dengan robust, tidak terdapatnya
heteroskedasticity yang sebelumnya terjadi pada regresi stepwise tanpa robust.

1) Berdasarkan hasil analisis regresi stepwise dengan robust, variabel yang dapat menjelaskan
PDRB dengan baik adalah variabel jumlah penduduk, variabel jumlah unit usaha besar
dan variabel jumlah ternak keluar. Dapat dilihat dari nilai P >|𝑡| masing-masing variabel
tersebut lebih kecil dari 0.05 yang berarti variabel tersebut signifikan terhadap variabel
dependen (PDRB)
2) Model regresi yang terbentuk adalah

Y = a + b X1 + b X2 + ….+ e
Y = 302669,4 +4,155299 X1 + 722198,4 X2 + 213,3486 X3
X1 = jumlah penduduk
X2 = jumlah unit usaha besar
X3 = jumlah ternak keluar
Jadi, variabel dependen PDRB dipengaruhi oleh tiga variabel prediktor (dari 8 variabel yang
dimasukkan) yaitu variabel jumlah penduduk, jumlah unit usaha besar, dan jumlah ternak
yang keluar. Berdasarkan model di atas dapat disimpulkan pola yang terbentuk adalah
semakin tinggi jumlah penduduk, jumlah unit usaha besar dan jumlah ternak yang keluar;
maka semakin tinggi pula nilai PDRB Provinsi Jawa Barat pada tahun 2006. Sebaliknya,
jika jumlah penduduk, jumlah unit usaha besar dan jumlah ternak yang keluar semakin
berkurang, maka nilai variabel jumlah PDRB Provinsi Jawa Barat tahun 2006 juga akan ikut
turun. Adapun penjelasan tiap variabel independen dengan PDRB sebagai berikut:

- Setiap penambahan 1% jumlah ternak yang keluar akan menambah jumlah PDRB
sebanyak 213,348 %.
- Setiap penambahan 1% jumlah penduduk akan meningkatkan jumlah PDRB sebanyak
4,155%.
- Setiap penambahan 1% jumlah unit usaha besar akan meningkatkan jumlah PDRB
sebanyak 722198,4 %.
Validasi model regresi ini dapat dilihat dari nilai R-Squared, yakni sebesar 73,29 %. Berarti
berdasarkan model tersebut, variabel independen yang ada mampu menjelaskan variabel
dependen sebesar 73,79%
3) Hasil analisis ini memiliki makna yang berarti dilihat dari nilai signifikansi pada model.
Model tersebut memiliki Nilai Prob > F 0,000. Karena nilai Prob > F lebih kecil dari 0,05,
hal ini menunjukkan model dapat merepresentasikan dunia nyata atau memiliki
keberartian.
4) Jika jumlah ternak yang keluar dari Provinsi Jawa Barat sebanyak 100.000, jumlah
penduduknya 10.000.000 jiwa jumlah penduduk dan jumlah unit usaha besar 100

PDRB = 302669,4 + 4,155299 (10.000.000) + 722198,4 (100) + 213,3486 (100.000)


= 135.356.509,4
Pustaka
Healey, J. 1997. Statistics: A Tool for Social Research. Wadsworth Publishing Company:
Washington.

Makridakis, S. et al. 1983. Forecasting: Methods & Apllications. John Willey & Son: New York.

Sawitri, Dewi. Maryati, Sri. 2014. Metode Analisis Perencanaan. Penerbit Universitas Terbuka:
Tangerang

Anda mungkin juga menyukai