Uji Korelasi
Uji korelasi bertujuan untuk melihat hubungan 2 buah variabel berskala numerik.
Sebelum melakukan uji korelasi dilakukan uji normalitas untuk melihat apakah data
berdistribusi normal atau tidak normal.
Apabila data berdistribusi normal maka pada Correlation Coefficient di centang pada
Pearson dan apabila data ordinal yang dicentang adalah Kendall’s tau-b dan bila data
berdistribusi tidak normal maka yang dicentang adalah Spearman.
Langkah-langkah uji korelasi
a. Pilih menu Analyze kemudian pilih Correlation → Bivariate
b. Maka akan muncul kotak dialog Bivariate Correlations → masukkan variabel salary
dan jobtime ke kolom Variables, kemudian centang Pearson pada Correlation
Coefficients kemudian pilih OK
Hasil uji dapat dilihat pada output
Correlations
salary jobtime
salary Pearson Correlation 1 .116**
Sig. (2-tailed) .000
N 1153 1153
jobtime Pearson Correlation .116** 1
Sig. (2-tailed) .000
N 1153 1153
Interpretasi:
Nilai Sig. = 0,000 ≤ 0,05, H0 ditolak artinya terdapat hubungan yang signifikan antara
salary dengan job time. Secara lebih mudahnya dapat dilihat dari adanya tanda bintang (*).
Apabila terdapat tanda bintang maka artinya signifikan (ada hubungan atau korelasi)
Interpretasi:
Hasil Uji Linearitas dapat di lihat pada Deviation from Linearity dimana Nilai
Sig. = 0.000 ≤ 0,05 artinya H0 ditolak sehingga dapat disimpulkan bahwa tidak ada
hubungan yang linier antara variable salary dengan jobtime
Uji linieritas juga bisa dilihat menggunakan grafik, dengan langkah berikut:
a. Pilih menu Analyze kemudian pilih Regresion → pilih Curve Estimation
b. Maka akan muncul kotak dialog Curve Estimation → masukkan variable salary
pada kolom Dependent(s), dan variabel jobtime pada kolom Independent →
pastikan pada bagian Models tercentang Linear kemudian OK
Pada Scatterplot dapat dilihat bahwa sebagian besar titik (data) yang menyebar.
Hubungan x dan y semakin linier apabila semakin banyak titik yang mendekati garis
linieritas.
Model Summary and Parameter Estimates
Dependent Variable: salary
Model Summary Parameter Estimates
Equation R Square F df1 df2 Sig. Constant b1
Linear .013 15.691 1 1151 .000 16393.528 216.221
The independent variable is jobtime.
Pada tabel Model Summay and Parameter Estimates dapat dilihat Nilai Sig. = 0.000
≤0.05 yang artinya H0 ditolak sehingga dapat disimpulkan bahwa tidak ada hubungan
yang linier antara variable salary dengan jobtime.
2. Homoskedastisitas
Homoskedastisitas merupakan kondisi ketika nilai residu pada tiap nilai prediksi
bervariasi dan variasinya cenderung konstan (titik pada grafik menyebar). Semakin
menyebar titik pada grafik, maka asumsi homoskedastisitas terpenuhi.
Penyebab Heteroskedastisitas (tidak homoskedastis):
Model Error: Kerangka konsep keliru dan tidak berdasarkan teori. Hal ini diatasi
dengan melakukan transformasi variabel atau membuat perubahan pada variabel
independen (seleksi variabel untuk model).
Kesalahan pengukuran: Variabel diukur dengan kesalahan, yang berasal dari alat
yang tidak akurat, kesalahpahaman responden, dll. (salah satunya menggunakan
kuisioner yang tidak valid dan reliabel).
Tidak memperhitungkan perbedaan di antara sub-populasi atau efek interaktif/efek
modifikasi dalam model (seperti perbedaan gender, perbedaan ras, perbedaan
daerah, dll.) Sub Group Analysis
Dampak Heteroskedastisitas (tidak homoskedastis):
Heteroskedastisitas tidak menghasilkan koefisien yang bias.
Menyebabkan Standard Error (SE) bias, yang menghasilkan SE sangat besar
(biasanya >1) dan interval kepercayaan (CI) yang lebar.
OLS tidak optimal jika terdapat heteroskedastisitas. Hal ini karena memberikan
bobot yang sama untuk semua pengamatan ketika, pada kenyataannya, pengamatan
dengan varians gangguan yang lebih besar mengandung informasi yang lebih
sedikit daripada pengamatan dengan varians gangguan yang lebih kecil.
Cara Mengatasi Heteroskedastisitas:
Jika mengetahui sumber heteroskedastisitas, kontrol pada sumbernya.
Jika tidak, maka:
Perbaiki model dengan mengatur variabel (paling mudah).
Gunakan variabel yang ditransformasi (paling mudah).
Gunakan Robust Standard Error (SE).
Gunakan weighted least squares (cenderung sulit dalam menentukan
weighting).
Langkah-langkah menilai homoskedastisitas
a. Pilih menu Anayze kemudian pilih Regression → pilih Linear
b. Maka akan muncul kotak dialog Liniear regression → masukkan variable salary pada
kolom Dependent dan variabel educ dan jobtime pada kolom Independent(s).
Selanjutnya pilih Plots maka akan muncul kotak dialog Liniear Regression Plots →
masukkan *SRESID pada kolom Y dan *ZPRED pada kolom X kemudian Continue
→ OK
Pada Scatterplot tampak titik tidak menyebar sehingga asumsi homoskedastisitas tidak
terpenuhi → heteroskedastisitas
Hasil uji normalitas menggunakan Q-Q Plots pada gambar diatas menunjukkan sebaran
data tidak mendekati garis lurus → data tidak berdistribusi normal.
Pada Test of normality Nilai Sig. = 0.000 ≤ 0,05 artinya H0 ditolak atau data tidak
berdistribusi normal.
4. Tidak ada multikolinearitas
Multikolinearitas adalah sebuah situasi yang menunjukkan adanya korelasi atau
hubungan kuat antara dua variable bebas atau lebih dalam sebuah model regresi.
Penyebab multikolinearitas adalah adanya beberapa variabel independent yang mengukur
hal yang sama (contoh usia dan tanggal, berat badan, tinggi badan dan IMT). Dampak
multikolinearitas adalah Standar Eror (SE) yang tinggi, semakin besar DE, maka semakin
tinggi multikolinearitas.
Cara mengatasi multikolinearitas:
Hilangkan/ganti variabel yang menimbulkan multikolinearitas
Buatkan index (indeks kekayaan, kombinasi variabel, dll)
Lakukan analisis alternatif yang dapat menangani korelasi variabel kolinear seperti
analisis faktor, analisis komponen utama, analisis klister.
Langkah-langkah uji asumsi multikolinieritas
a. Pada menu Analyze kemudian pilih Regression → pilih Linear
b. Maka akan muncul kotak dialog Linear Regression → masukkan variable salary ke
kolom Dependent dan variable educ dan jobtime ke kolom Independent (s)
kemudian pilih Statistics → selanjutnya centang Covariance matrix pada bagian
Regression Coefficient, centang Model fit dan Collinearity diagnostic kemudian
Continue → OK
Pada VIF variable educ dan jobtime nilainya < 10, sehingga tidak ada variable yang
menimbulkan multikolinieritas pada model.
5. Tidak Ada Autokorelasi
Autokorelasi adalah terjadinya korelasi antara sampel ke-i dengan observasi ke-n
(korelasi antar pengamatan/ sampel).
Model Summaryb
Model Durbin-Watson
1 1.829a
a. Predictors: (Constant), jobtime, educ
b. Dependent Variable: salary
Bandingkan nilai 1.829a pada Tabel Model Summaryb dengan Tabel Durbin Watson.
Jika nilai Durbin Watson pada tabel Model Summaryb berada di antara rentang Tabel
Durbin Watson, maka tidak terdapat masalah atau gejala autokorelasi. Namun bila
sebaliknya maka terdapat masalah atau gejala autokorelasi.
Pada contoh:
Jumlah variable independent adalah 2 (K=2)
Jumlah sampel (T) adalah 1153
Nilai Durbin Watson pada tabel Model Summaryb adalah 1.829
Maka diperoleh rentang nilai sesuai Tabel Durbin Watson sebesar 1.90133 – 1.90481
yang artinya nilai Durbin Watson hasil uji berada di luar rentang nilai pada Tabel Durbin
Watson atau terdapat autokorelasi.
Interpretasi:
Pada tabel Model summary nilai R square Change 0.443 artinya 44.3%
perubahan nilai variable terikat (Y) disebabkan karena perubahan pada
variable bebas (X).
Pada tabel Anova, nilai Sig.= 0.000 ≤ 0,05 yang artinya variable bebas (X)
berpengaruh secara stimultan terhadap variable terikat (Y).
Pada tabel Coefficients, Koefisien educ = 3941.53, Koefisien jobtime =
113.61, nilai Sig. = 0.000 ≤ 0.05, maka terdapat pengaruh X ke Y, dimana
edukasi lebih mempengaruhi salary dari pada jobtime.
Tapi bila dilihat ternyata standar errornya besar dan CI lebar sehingga bisa jadi
data tidak linier, tidak homoskedastisitas, tidak multikolinearitas (VIF<10), terjadi
autokorelasi (di luar rentang tabel Durbin Watson).