Dosen Pengampu :
Disusun oleh :
DEPARTEMEN STATISTIKA
FAKULTAS SAINS DAN ANALITIKA DATA
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA
2022
Data yang digunakan untuk tugas ini adalah data time series berupa data sekunder yang berasal
dari laporan Anggaran belanja Negara (APBN) dari tahun 1976 sampai dengan tahun 2007. Data
ini didapat dari skripsi berjudul “Analisis Regresi Linier Berganda dengan Heteroskedastisitas
Melalui Pendekatan Weight Least Square” oleh Lina Suli Farida. Data tersebut terdiri dari enam
variabel bebas dan satu variabel terikat yang kemudian akan dikombinasikan sehingga
membentuk beberapa model persamaan regresi untuk diketahui model yang tepat dan dilihat
pengaruh apa yang akan dihasilkan dari beberapa model tersebut.
Langkah kedua yang dilakukan adalah membuat model awal pada regresi linear berganda dengan
variabel variabel yang mempengaruhinya.
Setelah persamaan regresi didapatkan, maka terlebih dahulu diatasi jika ada kasus
multikolinearitas pada data. Terlihat bahwa nilai VIF pada variabel X1, X3, X5 dan X6 memiliki
nilai VIF >10 yang menunjukkan adanya multikolinearitas pada data. Selain itu, jika melihat
korelasi antar variabel independen, terlihat adanya korelasi yang cukup besar antara X1, X3, X5
dan X6 sehingga memungkinkan adanya kasus multikolinearitas.
Gambar 3. Korelasi
Untuk mengatasi kasus multikolinearitas, dapat dilakukan berbagai cara seperti regresi komponen
utama, regresi ridge, dan eliminasi backward yaitu dengan mengeliminasi variabel bebas yang
memiliki korelasi paling tinggi. Dipilih menggunakan regresi komponen utama.
Pertama, membentuk matriks Z yang terdiri atas matriks Z1-Z6, dari matriks yang telah di
centering dan discalling, yaitu dengan menggunakan rumus
x −x
Z i = ij i
si
n
si = (x
j =1
ij − xi ) 2
Gambar 4. Matriks Z
Nilai eigen yang lebih dari 1 hanya ada pada nilai eigen ke-1 dan ke-2. Dengan demikian prediktor
yang dibentuk adalah 2. Selanjutnya membentuk matriks W yang merupakan kombinasi linear dari
principal component.
• Hubungan antara w1 dengan z1-z6
w1 = 0, 478z1 + 0,308z2 + 0, 470 z3 + 0,013z4 + 0, 477 z5 + 0, 477 z6
• Hubungan antara w2 dengan z1-z6
w2 = −0,060 z1 + 0,561z2 − 0,147 z3 + 0,802 z4 − 0,093z5 − 0,086 z6
Elemen pada matriks W didapatkan dengan mensubstitusi nilai z1-z6 ke setiap persamaan diatas
Gambar 7. Matriks W
x1 − x1 x −x x −x
y = 0,1991 − 0, 051( ) − 0, 0231( 2 2 ) − 0, 0513( 3 3 )
s1 s2 s3
x4 − x4 x −x x −x
+0, 00119( ) − 0, 051( 5 5 ) − 0, 0511( 7 7 )
s4 s5 s7
Setelah asumsi multikolinearitas berhasil diatasi, maka selanjutnya medeteksi uji asumsi
heteroskedastisitas. Heteroskedastisitas adalah keadaan dimana semua residual atau error
mempunyai varians yang tidak konstan atau berubah-ubah Dalam praktiknya, Heteroskedastisitas
banyak ditemui pada data crosssection karena pengamatan dilakukan pada individu berbeda pada
saat yang sama. Akan tetapi bukan berarti Heteroskedastisitas tidak ada dalam data timeseries.
Ada beberapa alasan yang menyebabkan varians kesalahan pengganggu menjadi variabel yang
selalu berubah, antara lain sebagai berikut:
1. Basis data dari satu atau lebih variabel mengandung nilai-nilai dengan satuan jarak yang
lebar, yaitu jarak antara nilai yang paling kecil dengan yang paling besar adalah lebar.
2. Perbedaan laju pertumbuhan antara variabel-variabel dependen dan independen adalah
signifikan dalam periode pengamatan untuk data time series.
3. Terdapat situasi error learning, misalnya kita ingin mengetahui hubungan tingkat kesalahan
mengetik terhadap berbagai variabel. Jika kita menggunakan sampel yang bersifat
panel/time series akan sangat mungkin model yang dimiliki akan bersifat heteroskedastis.
Hal ini disebabkan kesalahan pengetikan akan menurun dari waktu ke waktu dan terjadi
konvergensi diantara elemen sampel (kesalahan anggota sample yang paling tidak terampil
akan menurun mendekati mereka yang awalnya sudah terampil).
4. Peningkatan diskresi.
5. Perbaikan tehnik pengambilan data. Dampaknya varians tiap individu akan menurun.
Adanya Heteroskedastisitas bukan berarti suatu model regresi adalah lemah. Jika regresi dengan
Ordinary Least Square tetap dilakukan dengan adanya heteroskedastisitas maka akan diperoleh
koefisien-koefisien hasil estimasi parameter regresi sampai dalam persamaan tetap tidak bias, akan
tetapi nilai-nilai koefisien tersebut berfluktuasi lebih tajam daripada nilai-nilai normalnya. Dengan
kata lain, jika model itu diperbaharui ulang dengan menambah data atau dengan sampel-sampel
yang digunakan berbeda, maka koefisien-koefisien hasil estimasi akan bervariasi secara signifikan
diseputar nilai rata-ratanya. Karena ayunan yang lebar pada koefisien-koefisien hasil estimasi,
maka kesalahan dari suatu taksiran tunggal pada masing-masing model yang diperbaharui akan
juga berubah-ubah secara lebar sehingga taksiran akan menjadi kurang efisien daripada
seharusnya.
Pada gambat terbentuk pola linear menurun dan menaik. Yang menunjukkan bahwa adanya
kasus heteroskedastisitas. Kemungkinan adanya hubungan kuadratik antara yfit dengan
residual.
2. Menggunakan uji formal seperti antara lain uji Park, uji Glejser, Uji Korelasi Rank dari
Spearman, uji Goldfeld-Quandt, uji White. Dipilih menggunakan uji glejser, uji park, dan
uji korelasi rank dari spearman,
Uji Glesjer dilakukan dengan meregresikan residual terhadap variabel independen untuk
mendapatkan prediktor.
H0 : j = 0
H1 : j 0
j
thit =
se( j )
Tolak H0 jika |Thit| t ( n − p −1)
atau pvalue<
2
Gambar 10. Hasil Uji Glejser
Dari pengujian glejser diatas, diketahui bahwa seluruh variabel memiliki nilai pvalue > 0,05,
hal ini menunjukkan bahwa tidak terjadi gejala/ terbebas dari uji heteroskedastisitas. Namun,
bisa jadi hal ini kurang tepat mengingat uji glejser sesuai jika memiliki data yang cukup
banyak. Untuk itu dilakukan pengujian park.
Uji Park yang pada prinsipnya meregresikan nilai logaritma natural dari residual kuadrat.
Berikut ini adalah transformasi data pada residual dan variabel independen
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 11.001 32.531 .338 .738
lnX1 -2.947 8.004 -1.895 -.368 .716
lnX2 .153 .468 .082 .328 .746
lnX3 -4.527 1.650 -2.800 -2.744 .011
lnX4 1.040 1.105 .210 .941 .355
lnX5 6.885 15.139 5.456 .455 .653
lnX6 -1.144 8.079 -1.012 -.142 .889
a. Dependent Variable: lnres
Gambar 12. Hasil Uji Park
Dari pengujian tersebut, diketahui bahwa pvalue dari variabel x3 adalah 0,011 < alpha yang
menunjukkan adanya kasus heteroskedastisitas.
Selanjutnya dilakukan pengujian korelasi rank spearman. Setelah didapatkan residual dari model
regresi linear yang telah diatasi kasus multikolinearitasnya. Maka dilakukan korelasi bivariate
spearman dengan memasukkan seluruh variabel independen dan residual. Berikut ini adalah hasil
output spss
Gambar 13. Hasil Uji Korelasi Rank Spearman
Dari output diatas, diketahui bahwa nilai pvalue dari variabel X1,X3,X5, dan x6 < 0,05 yang
artinya terdapat masalah atau gejala heteroskedastisitas
Untuk itu, perlu ditangani terlebih dahulu yaitu dengan cara menggunakan weigthed least square
dengan menggunakan pembobot ataupun menggunakan transformasi. Peneliti telah mencoba
1 1
melakukan weigthed least square dengan menggunakan pembobot , namun belum dapat
xi xi
Setelah itu, dilakukan pengujian glesjer kembali untuk membuktikan ada tidaknya kasus
heteroskedastisitas.
1 1 1 1 1 1 1
= 0 + 1 + 2 + 3 + 4 + 5 + 6
ln( yi ) ln( x1 ) ln( x2 ) ln( x3 ) ln( x4 ) ln( x5 ) ln( x6 )
1 1 1 1 1 1 1
= 0, 08 + 78, 680 + 4,167 − 19, 294 − 0,339 − 69, 265 + 14, 780
ln( yi ) ln( x1 ) ln( x2 ) ln( x3 ) ln( x4 ) ln( x5 ) ln( x6 )