Anda di halaman 1dari 10

Korelasi dan Regresi Linier

Uji Korelasi
Uji korelasi bertujuan untuk melihat hubungan 2 buah variabel berskala numerik.
Sebelum melakukan uji korelasi dilakukan uji normalitas untuk melihat apakah data
berdistribusi normal atau tidak normal.
Apabila data berdistribusi normal maka pada Correlation Coefficient di centang pada
Pearson dan apabila data ordinal yang dicentang adalah Kendall’s tau-b dan bila data
berdistribusi tidak normal maka yang dicentang adalah Spearman.
Langkah-langkah uji korelasi
a. Pilih menu Analyze kemudian pilih Correlation → Bivariate
b. Maka akan muncul kotak dialog Bivariate Correlations → masukkan variabel salary
dan jobtime ke kolom Variables, kemudian centang Pearson pada Correlation
Coefficients kemudian pilih OK
Hasil uji dapat dilihat pada output

Correlations
salary jobtime
salary Pearson Correlation 1 .116**
Sig. (2-tailed) .000
N 1153 1153
jobtime Pearson Correlation .116** 1
Sig. (2-tailed) .000
N 1153 1153

**. Correlation is significant at the 0.01 level (2-tailed).

Interpretasi:
Nilai Sig. = 0,000 ≤ 0,05, H0 ditolak artinya terdapat hubungan yang signifikan antara
salary dengan job time. Secara lebih mudahnya dapat dilihat dari adanya tanda bintang (*).
Apabila terdapat tanda bintang maka artinya signifikan (ada hubungan atau korelasi)

Uji Regresi Linier


Regresi linier adalah metode atau alat statistik untuk menilai hubungan antara dua
variabel untuk mencari nilai mana yang paling mewakili hubungannya. Pada regeresi
linier variabel dependennya adalah skala numerik. Tujuan utama dari regresi linier adalah
mempelajari hubungan sebab-akibat antara variabel bebas X terhadap variabel tergantung
Y. Dalam regresi, variabel bebas juga disebut sebagai variabel prediktor karena nilai
variabel y dapat dipredikasi dari nilai variabel X berdasarkan persamaan regresi antara
variabel Y dengan X.
Asumsi Dasar Regresi Linier
 Linieritas : hubungan antara x dan mean dari y mengikuti garis
lurus (diperiksa dengan scatter plot)
 Homoskedastisitas : kondisi ketika nilai residu pada tiap nilai
prediksi bervariasi dan variasinyacenderung konstan
 Data berdistribusi normal (pengambilan sampel yang baik)
 Tidak ada multikolinieritas: variabel independent tidak boleh dikorelasikan
 Tidak ada autokorelasi

Langkah langkah pengecekan asumsi dasar regresi linier


1. Linieritas
Linieritas merupakan sifat hubungan yang linier antar variabel, artinya setiap
perubahan yang terjadi pada satu varabel akan diikuti perubahan dengan besaran yang
sejajar pada variabel lainnya.
Hipotesis pengambilan keputusan uji linearitas:
 Ho : terdapat hubungan yang linier antara X dan Y
 Ha : tidak terdapat hubungan yang linier antara X dan Y
 Jika p-value ≤ 0,05 Ho ditolak (Ha diterima)
 Jika p-value > 0,05 Ho diterima (Ha ditolak)

Langkah-langkah Uji Linieritas dengan menggunakan Compare Mean


a. Pilih menu Analyze kemudian pilih Compare Mean → pilih Means
b. Maka akan muncul kotak dialog Means → masukan variabel salary pada kolom
Dependent list dan jobtime pada kolom Independent List → pilih Options maka
akan muncul kotak dialog Options lalu centang Test for Linearity pada bagian
Statistics for First Layer kemudian Continue → OK
Hasil uji dapat dilihat pada output
ANOVA Table
Sum of Squares df Mean Square F Sig.
salary * Between (Combined) 38171644028.020 35 1090618400.801 4.050 .000
jobtime Groups Linearity 4558342410.244 1 4558342410.244 16.929 .000
Deviation 33613301617.776 34 988626518.170 3.672 .000
from
Linearity
Within Groups 300761200805.154 1117 269258013.254
Total 338932844833.174 1152

Interpretasi:
Hasil Uji Linearitas dapat di lihat pada Deviation from Linearity dimana Nilai
Sig. = 0.000 ≤ 0,05 artinya H0 ditolak sehingga dapat disimpulkan bahwa tidak ada
hubungan yang linier antara variable salary dengan jobtime
Uji linieritas juga bisa dilihat menggunakan grafik, dengan langkah berikut:
a. Pilih menu Analyze kemudian pilih Regresion → pilih Curve Estimation
b. Maka akan muncul kotak dialog Curve Estimation → masukkan variable salary
pada kolom Dependent(s), dan variabel jobtime pada kolom Independent →
pastikan pada bagian Models tercentang Linear kemudian OK

Hasil grafik dapat dilihat pada output:

Pada Scatterplot dapat dilihat bahwa sebagian besar titik (data) yang menyebar.
Hubungan x dan y semakin linier apabila semakin banyak titik yang mendekati garis
linieritas.
Model Summary and Parameter Estimates
Dependent Variable: salary
Model Summary Parameter Estimates
Equation R Square F df1 df2 Sig. Constant b1
Linear .013 15.691 1 1151 .000 16393.528 216.221
The independent variable is jobtime.

Pada tabel Model Summay and Parameter Estimates dapat dilihat Nilai Sig. = 0.000
≤0.05 yang artinya H0 ditolak sehingga dapat disimpulkan bahwa tidak ada hubungan
yang linier antara variable salary dengan jobtime.

2. Homoskedastisitas
Homoskedastisitas merupakan kondisi ketika nilai residu pada tiap nilai prediksi
bervariasi dan variasinya cenderung konstan (titik pada grafik menyebar). Semakin
menyebar titik pada grafik, maka asumsi homoskedastisitas terpenuhi.
Penyebab Heteroskedastisitas (tidak homoskedastis):
 Model Error: Kerangka konsep keliru dan tidak berdasarkan teori. Hal ini diatasi
dengan melakukan transformasi variabel atau membuat perubahan pada variabel
independen (seleksi variabel untuk model).
 Kesalahan pengukuran: Variabel diukur dengan kesalahan, yang berasal dari alat
yang tidak akurat, kesalahpahaman responden, dll. (salah satunya menggunakan
kuisioner yang tidak valid dan reliabel).
 Tidak memperhitungkan perbedaan di antara sub-populasi atau efek interaktif/efek
modifikasi dalam model (seperti perbedaan gender, perbedaan ras, perbedaan
daerah, dll.)  Sub Group Analysis
Dampak Heteroskedastisitas (tidak homoskedastis):
 Heteroskedastisitas tidak menghasilkan koefisien yang bias.
 Menyebabkan Standard Error (SE) bias, yang menghasilkan SE sangat besar
(biasanya >1) dan interval kepercayaan (CI) yang lebar.
 OLS tidak optimal jika terdapat heteroskedastisitas. Hal ini karena memberikan
bobot yang sama untuk semua pengamatan ketika, pada kenyataannya, pengamatan
dengan varians gangguan yang lebih besar mengandung informasi yang lebih
sedikit daripada pengamatan dengan varians gangguan yang lebih kecil.
Cara Mengatasi Heteroskedastisitas:
 Jika mengetahui sumber heteroskedastisitas, kontrol pada sumbernya.
 Jika tidak, maka:
 Perbaiki model dengan mengatur variabel (paling mudah).
 Gunakan variabel yang ditransformasi (paling mudah).
 Gunakan Robust Standard Error (SE).
 Gunakan weighted least squares (cenderung sulit dalam menentukan
weighting).
Langkah-langkah menilai homoskedastisitas
a. Pilih menu Anayze kemudian pilih Regression → pilih Linear
b. Maka akan muncul kotak dialog Liniear regression → masukkan variable salary pada
kolom Dependent dan variabel educ dan jobtime pada kolom Independent(s).
Selanjutnya pilih Plots maka akan muncul kotak dialog Liniear Regression Plots →
masukkan *SRESID pada kolom Y dan *ZPRED pada kolom X kemudian Continue
→ OK

Hasil uji dapat dilihat pada output

Pada Scatterplot tampak titik tidak menyebar sehingga asumsi homoskedastisitas tidak
terpenuhi → heteroskedastisitas

3. Distribusi Data Normal


Apabila data berdistribusi normal (khusus variabel dependent), maka sampel penelitian
cenderung representative yaitu memenuhi Central Limit Theorem. Pada kondisi lapangan,
asumsi normalitas dicapai apabila sampel besar (n > 30), semakin besar sampel maka
semakin bagus.
Hipotesis:
 Ho : data berdistribusi normal
 Ha : data tidak berdistribusi normal
 Jika p-value ≤ 0, 05 Ho ditolak (data tidak berdistribusi normal)
 Jika p-value > 0, 05 Ho diterima (data berdistribusi normal)
Langkah-langkah uji normalitas dengan menggunakan Q-Q Plot:
a. Pilih menu Analyze kemudian pilih Descriptive Statistics → pilih Explore
b. Maka akan muncul kotak dialog Explore → masukkan variable salary ke kolom
Dependent List kemudian pilih Plots → selanjutnya centang Normality plots with test
kemudian Continue → OK

Hasil uji dapat di lihat pada output


Pada Q-Q plot jika sebaran data mendekati garis lurus, maka data berdistribusi
normal.

Hasil uji normalitas menggunakan Q-Q Plots pada gambar diatas menunjukkan sebaran
data tidak mendekati garis lurus → data tidak berdistribusi normal.

Pada Test of normality Nilai Sig. = 0.000 ≤ 0,05 artinya H0 ditolak atau data tidak
berdistribusi normal.
4. Tidak ada multikolinearitas
Multikolinearitas adalah sebuah situasi yang menunjukkan adanya korelasi atau
hubungan kuat antara dua variable bebas atau lebih dalam sebuah model regresi.
Penyebab multikolinearitas adalah adanya beberapa variabel independent yang mengukur
hal yang sama (contoh usia dan tanggal, berat badan, tinggi badan dan IMT). Dampak
multikolinearitas adalah Standar Eror (SE) yang tinggi, semakin besar DE, maka semakin
tinggi multikolinearitas.
Cara mengatasi multikolinearitas:
 Hilangkan/ganti variabel yang menimbulkan multikolinearitas
 Buatkan index (indeks kekayaan, kombinasi variabel, dll)
 Lakukan analisis alternatif yang dapat menangani korelasi variabel kolinear seperti
analisis faktor, analisis komponen utama, analisis klister.
Langkah-langkah uji asumsi multikolinieritas
a. Pada menu Analyze kemudian pilih Regression → pilih Linear
b. Maka akan muncul kotak dialog Linear Regression → masukkan variable salary ke
kolom Dependent dan variable educ dan jobtime ke kolom Independent (s)
kemudian pilih Statistics → selanjutnya centang Covariance matrix pada bagian
Regression Coefficient, centang Model fit dan Collinearity diagnostic kemudian
Continue → OK

Hasil uji dapat dilihat pada output


Coefficientsa
Standardized
Unstandardized Coefficients Coefficients Collinearity Statistics

Model B Std. Error Beta t Sig. Tolerance VIF


1 (Constant) -28170.312 3763.108 -7.486 .000

educ 3941.530 132.346 .658 29.782 .000 .993 1.007

jobtime 113.603 41.176 .061 2.759 .006 .993 1.007

a. Dependent Variable: salary

Pada VIF variable educ dan jobtime nilainya < 10, sehingga tidak ada variable yang
menimbulkan multikolinieritas pada model.
5. Tidak Ada Autokorelasi
Autokorelasi adalah terjadinya korelasi antara sampel ke-i dengan observasi ke-n
(korelasi antar pengamatan/ sampel).

Langkah-langkah uji asumsi autokorelasi:


a. Pilih menu Analyze kemudian pilih Regression → pilih Linier
b. Maka akan muncul kotak dialog Linear Regression → masukkan variabel salary pada
kolom Dependent dan variable educ dan jobtime pada kolom Independent (s)
kemudian pilih Statistics → selanjutnya centang Durbin-Watson pada bagian
Residuals kemudian Continue → OK

Hasil uji dapat dilihat pada output:

Model Summaryb
Model Durbin-Watson
1 1.829a
a. Predictors: (Constant), jobtime, educ
b. Dependent Variable: salary

Bandingkan nilai 1.829a pada Tabel Model Summaryb dengan Tabel Durbin Watson.
Jika nilai Durbin Watson pada tabel Model Summaryb berada di antara rentang Tabel
Durbin Watson, maka tidak terdapat masalah atau gejala autokorelasi. Namun bila
sebaliknya maka terdapat masalah atau gejala autokorelasi.

Pada contoh:
Jumlah variable independent adalah 2 (K=2)
Jumlah sampel (T) adalah 1153
Nilai Durbin Watson pada tabel Model Summaryb adalah 1.829
Maka diperoleh rentang nilai sesuai Tabel Durbin Watson sebesar 1.90133 – 1.90481
yang artinya nilai Durbin Watson hasil uji berada di luar rentang nilai pada Tabel Durbin
Watson atau terdapat autokorelasi.

6. Membandingkan Model Regresi


Langkah-langkah dalam membandingkan model regresi:
a. Pilih menu Analyze kemudian pilih Regression → pilih Linear
b. Maka akan muncul kotak dialog Linear Regression → masukkan variabel salary pada
kolom Dependent dan variabel educ dan jobtime pada kolom Block 1 of 1 kemudian
pilih Statistics → selanjutnya centang Estimates, Confident Intervals 95%,
Covariance matrix, Model fit, R squared change, Descriptives, Part and partial
correlation, Collinearity diagnostic, Durbin watson kemudian Continue → OK
Hasil uji dapat dilihat pada output

Interpretasi:
 Pada tabel Model summary nilai R square Change 0.443 artinya 44.3%
perubahan nilai variable terikat (Y) disebabkan karena perubahan pada
variable bebas (X).
 Pada tabel Anova, nilai Sig.= 0.000 ≤ 0,05 yang artinya variable bebas (X)
berpengaruh secara stimultan terhadap variable terikat (Y).
 Pada tabel Coefficients, Koefisien educ = 3941.53, Koefisien jobtime =
113.61, nilai Sig. = 0.000 ≤ 0.05, maka terdapat pengaruh X ke Y, dimana
edukasi lebih mempengaruhi salary dari pada jobtime.

Tapi bila dilihat ternyata standar errornya besar dan CI lebar sehingga bisa jadi
data tidak linier, tidak homoskedastisitas, tidak multikolinearitas (VIF<10), terjadi
autokorelasi (di luar rentang tabel Durbin Watson).

Anda mungkin juga menyukai