REGRESI
KORELASI
• Analisis korelasi bertujuan untuk
mengetahui pola dan keeratan
hubungan antara dua atau lebih
variabel.
• “Correlation does not imply
causation”, atau korelasi tidak
mengisyaratkan kejadian sebab
akibat.
ARAH KORELASI
15
10
Series1
Y
0
0 5 10 15
X
ARAH KORELASI
Contoh Hubungan Negatif
• Inverse Correlation (Negative
Correlation)
20
15
10 Series1
Y
0
0 5 10 15 20
X
KOEFISIEN KORELASI
• Koefisien korelasi sering dilambangkan dengan
huruf (r). Koefisien korelasi dinyatakan dengan
bilangan, bergerak antara 0 sampai +1 atau 0
sampai -1.
• Jika nilai r < 0, artinya telah terjadi hubungan yang linier negative
(negative correlation), yaitu makin besar nilai variabel X makin
kecil nilai variabel Y, atau makin kecil nilai variabel X maka makin
besar pula nilai variabel Y.
Correlations
umur susu
umur Pearson Correlation 1 .951**
tinggi daun
Spearman's rho tinggi Correlation 1.000 .943**
Coefficient
N 15 15
N 15 15
Stat 79 80 89 65 67 62 61 68 81 84
Dimana :
Y = merupakan variabel bergantung (dependent variable)
X = sebagai variabel bebas (independent variable)
a = sebagai konstanta regresi
b = slope atau kemiringan garis regresi
e = error
Contoh :
Sebuah perusahaan yang bergerak di bidang perikanan sedang
menganalisis tingkat keasinan atau salinitas tambak dengan
produktivitas tambaknya, data-datanya sebagai berikut :
No. Salinitas (mmgram/liter) (X) Produksi (ton) (Y)
1 250 69
2 300 71
3 400 78
4 100 50
5 250 65
6 270 70
7 180 57
8 415 80
9 300 77
10 435 82
11 350 78
12 200 58
13 275 62
14 250 53
15 325 75
16 270 73
PENYELESAIAN DENGAN
SPSS
1. Entrilah data ke lembar kerja SPSS.
2. Klik Variable View di pojok kiri bawah.
3. Pada kolom Name isikan sesuai dengan nama
variabelnya, variabel pertama diberi nama Salinitas
dan variabel kedua diberi nama Produksi.
4. Klik Analyze, Regression, Linear.
5. Pindahkan variabel Salinitas sebagai variabel
bebas ke kolom independent(s), dan variabel
Produksi sebagai variabel tergantung ke kolom
dependent.
6. Klik menu Statistics, tandai Estimates,
Confidence intervals, Model fits dan
Descriptives. Kemudian klik Continue.
PENYELESAIAN DENGAN
SPSS
Pada kotak Regression Coefficients terdapat beberapa item
yaitu :
1. Estimates, berguna untuk memperkirakan hasil analisis
regresi. Jika pilihan ini tidak diaktifkan, koefisien regresi tidak
akan ditampilkan sehingga kita sulit membuat persamaan
regresinya.
2. Confidence intervals, merupakan interval taraf kepercayaan
dari persamaan regresi yang didapat. Pada interval taraf
kepercayaan akan ditampilkan lower bound dan upper bound
kurva normal.
3. Covariance matrix, akan menampilkan matrik varian/kovarian.
4. Model fit, akan menampilkan analisis regresi yang disertakan
analisis varian atau uji F regresi. Uji F ini berguna untuk
mengetahui semua variabel independen (variabel bebas) yang
berpengaruh terhadap variabel dependen (variabel
bergantung).
PENYELESAIAN DENGAN SPSS
7. Klik Options.
• Use probability of F digunakan untuk menentukan taraf
kesalahan berapa variabel independen yang akan dikeluarkan dari
persamaan dan taraf kesalahan berapa variabel independen yang
akan dimasukkan dalam persamaan. Pada kondisi default,
variabel independen akan masuk dalam persamaan jika
kesalahannya kurang dari 0.05 (5%) dan dikeluarkan jika lebih dari
0.1 (10%).
• Use F value juga digunakan untuk menentukan taraf kesalahan
berapa variabel independen yang akan dikeluarkan dari
persamaan dan taraf kesalahan berapa variabel independen yang
akan dimasukkan dalam persamaan. Kalau pada Use probability
of F, angka yang digunakan adalah angka probabilitas, Use F
value menggunakan nilai F pada tabel.
• Include constant in equation digunakan untuk menampilkan
konstanta persamaan garis regresi.
8. Pada pilihan Missing Values pilih Replace with mean artinya
data-data yang hilang digantikan dengan rata-rata.
9.Klik Continue, OK
OUTPUT
Descriptive Statistics
Tabel Correlation
Korelasi Pearson (Pearson Correlation) = 0,891
Nilai 0,891 adalah nilai r hitung. Angka tersebut menunjukkan terjadi korelasi yang
sangat kuat antara kadar garam dengan produktivitas udang di tambak. Hubungan
bersifat positive correlation, artinya penambahan kadar garam akan menambah
produktivitas udang.
Model Summary
• Std. Error of the Estimation merupakan kesalahan standar dari penaksiran, bernilai 4,372.
OUTPUT
ANOVAb
Sum of Mean
Model Squares df Square F Sig. a
1 Regression 1204.308 1 1204.308 53.791 .000
Residual 313.442 14 22.389
Total 1517.750 15
a. Predictors: (Constant), Salinitas
b. Dependent Variable: Produksi
INTERPRETASI
Tabel Anova
Pada analisis kali ini kita menggunakan model regresi linier sederhana dengan model
persamaan Y = a + bX. Apakah pilihan model tersebut sudah tepat? Dapat diterima? Mengapa
tidak menggunakan model lain saja? Pertanyaan tersebut dijawab dengan melihat nilai F
hitung pada tabel ANOVA di atas. Dari hasil komputasi didapat nilai F hitung sebesar 53,791.
• Untuk menguji apakah model linier Y = a + bX tersebut sudah tepat atau belum, maka F
hitung pada tabel anova perlu dibandingkan dengan F tabel.
F hitung = 53,791
F tabel dilihat pada :
Taraf signifikansi 5%
-df pembilang = jumlah variabel – 1 = (2 – 1) = 1
-df penyebut = jumlah data – jumlah variabel = (16 – 2) = 14
F tabel = 4,60
Karena F hitung > F tabel, dapat disimpulkan bahwa model linier Y = a + bx sudah tepat dan
dapat digunakan.
• Selain membandingkan F hitung dengan F tabel ada cara yang lebih mudah untuk
menentukan ketepatan model di atas, yaitu dengan membandingkan probabilitas (pada tabel
Anova tertulis Sig) dengan taraf nyatanya (α = 0,05 atau 0,01).
Jika probabilitas > 0,05 maka model ditolak.
Jika probabilitas < 0,05 maka model diterima.
• Dapat dilihat nilai probabilitas (Sig) adalah 0,000 < 0,05 berarti model diterima atau dapat
disimpulkan bahwa bentuk persamaan linier Y = a + bX sudah tepat dan dapat
dipertanggungjawabkan.
OUTPUT
Coefficientsa
Standar
dized 95.0%
Unstandardized Coeffici Confidence
Coefficients ents Interval for B
Variables Entered/Removedb
Model Summary
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 260.229 2 130.115 115.620 .000a
Residual 13.504 12 1.125
Total 273.733 14
a. Predictors: (Constant), pemupukan , curah hujan
b. Dependent Variable: produktivitas
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 8.754 1.164 7.523 .000
curah hujan .078 .019 .470 4.064 .002
pemupukan .327 .069 .548 4.741 .000
a. Dependent Variable: produktivitas
INTERPRETASI
• Tabel Variables Entered/Removed
Tabel ini memberikan informasi tentang variabel-variabel independen
yang kurang berpengaruh terhadap variabel dependen sehingga
akan dikeluarkan dari persamaan. Dapat dilihat pada kolom
variables removed tidak terdapat variabel yang dikeluarkan.
• Tabel Model Summary
Menerangkan besarnya korelasi (R), koefisien determinasi (R 2),
koefisien determinasi yang disesuaikan (adjusted R 2) dan standar
error.
Koefisien korelasi (R) sebesar 0,975, mendekati nilai1 artinya
hubungan antara variabel-variabel independen (X 1, X2) dan
dependen (Y) sangat erat. Korelasi antara variabel dependen dan
independen bersifat positif. Artinya, jika nilai X naik, maka akan
direspon dengan kenaikan nilai Y.
Koefisien determinasi (R2) sebesar 0,951, artinya bahwa 95,1%
produksi padi tadah hujan dipengaruhi oleh faktor curah hujan dan
pemupukan. Sedangkan 4,9% (100% - 95,1%) karena faktor-
faktor lain yang tidak dapat dijelaskan dalam persamaan regresi
tersebut.
Koefisien determinasi dapat dihitung dengan mengkuadratkan
koefisien korelasi.
INTERPRETASI
• Tabel ANOVA
Persamaan regresi yang kita gunakan adalah :
Y = a + b1X1 + b2X2
Apakah model hubungan antara X1, X2 dan Y hanya ada model linier seperti di
atas? Jelas tidak, sebenarnya model-model persamaan masih sangat banyak.
Jadi, mengapa kita menggunakan persamaan linier? Apakah model tersebut
sesuai? Pertanyaan tersebut akan terjawab dari tabel ANOVA.
F hitung digunakan untuk menguji apakah model persamaan
Y = a + b1X1 + b2X2 yang diajukan dapat diterima atau tidak.
Caranya dengan membandingkan F hitung tersebut dengan F tabel.
Jika F hitung > F tabel, maka model di atas dapat diterima dan sebaliknya.
-F hitung = 115,62
-F tabel dapat dilihat pada α = 0,05 dengan
Derajad bebas pembilang = (k – 1)= 3 – 1 = 2
Derajad penyebut = (n – k) = 15 – 3 = 12
-F tabel 0,05 (2;12) = 3,89
Karena F hitung > F tabel, dapat disimpulkan bahwa model yang digunakan
sudah tepat.
Untuk lebih mudahnya dapat dengan melihat probabilitasnya. Jika probabilitas
< taraf signifikansi (α =0,05),maka model diterima. Dan sebaliknya, dapat
dilihat probabilitasnya adalah 0,000 < 0,05 maka model persamaan Y = a +
b1X1 + b2X2 yang digunakan dapat diterima.
INTERPRETASI
• Tabel Coefficients
Setelah menguji signifikansi persamaan regresi, selanjutnya perlu diuji apakah
masing-masing variabel independen (X1, X2) mempunyai pengaruh yang nyata
terhadap Y. Untuk itu dilakukan uji t.
• Hipotesis :
Ho : Variabel independen tidak mempengaruhi variabel dependen secara nyata.
Ha : Variabel bebas berpengaruh nyata terhadap variabel dependen.
• Pengambilan Keputusan :
Jika –t tabel < t hitung < t tabel, Ho diterima.
Jika t hitung < -t tabel atau t hitung > t tabel, Ho ditolak.
t tabel dilihat dengan derajad bebas = n – k
n = jumlah sampel dalam hal ini = 15
k = jumlah variabel yang digunakan = 3
sehingga derajad bebasnya = 15 – 3 = 12
Uji t dilakukan uji dua arah (2 tailed) sehingga cara membaca t tabelnya sedikit
berbeda, t tabel dibaca pada t ½ α atau t ½ (0,05) atau t 0,025.
-t tabel = 2,560
-t hitung (X1) =4,062
-t hitung (X2) = 4,741
INTERPRETASI
• Keputusan :
• Variabel Curah Hujan (X1)
Karena t hitung (4,062) > t tabel
(2,560) maka Ho ditolak, artinya curah
hujan berpengaruh nyata terhadap
produktivitas padi.
• Variabel Pemupukan (X2)
Karena t hitung (4,741) > t tabel
(2,560) maka Ho ditolak, artinya
produktivitas dapat dipengaruhi secara
nyata oleh faktor pemupukan.
INTERPRETASI
Model Summary
Std. Error of the
Model R R Square Adjusted R Square Estimate
1 .912 a
.831 .799 .28981
a. Predictors: (Constant), Promosi, Kualitas, Produksi
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 6.608 3 2.203 26.225 .000a
Residual 1.344 16 .084
Total 7.952 19
a. Predictors: (Constant), Promosi, Kualitas, Produksi
b. Dependent Variable: Pendapatan
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3.332 .503 6.622 .000
Kualitas -.559 .182 -.316 -3.070 .007
Produksi 1.486 .332 .507 4.478 .000
Promosi .019 .004 .487 4.291 .001
INTERPRETASI
Tabel Variables Entered/Removed
Semua variabel masuk di dalam kolom variables entered,artinya
semua variabel dimasukkan dalam persamaan dan tidak ada
variabel yang dikeluarkan.
Tabel Model Summary
Pada tabel ini dapat dilihat nilai koefisien korelasi (R) sebesar 0,912
menunjukkan hubungan yang sangat kuat. Koefisien determinasi
(R2) sebesar 0,831 artinya naik turunnya pendapatan perusahaan
83,1% disebabkan pengaruh Kualitas, Produksi dan Promosi.
Hanya 16,9% yang tidak diketahui.
Adjusted R Square merupakan koreksi dari R2 sehingga
gambarannya lebih mendekati mutu penjajakan model populasi. R 2
yang disesuaikan dirumuskan sebagai berikut :
2 n 1
Adjusted R 2
1 1 R
nk
Dimana
n = jumlah sampel
k= jumlah parameter
INTERPRETASI
• Tabel Anova
Dari tabel Anova dapat dilihat nilai F
hitung 26,265.
F tabel 0.05 (3;16) adalah 3,24.
Karena F hitung > F tabel atau melihat
probabilitasnya (Sig) yang lebih kecil dari
taraf signifikansi (0,000 < 0,05), dapat
disimpulkan bahwa model persamaan
Y = a + b1X1 + b2X2 + b3X3 yang diajukan
dapat diterima.
INTERPRETASI
• Tabel Coefficients
Dilakukan uji t untuk menguji signifikansi koefisien regresi dari setiap variabel independen.
• Hipotesis
Ho = Variabel bebas tidak berpengaruh nyata terhadap variabel dependen.
Ha = Variabel bebas berpengaruh nyata terhadap variabel dependen.
• Pengambilan Keputusan
Jika –t tabel < t hitung < t tabel, maka Ho diterima.
Jika t hitung < -t tabel atau t hitung > t tabel, maka Ho ditolak.
• Keputusan :
t tabel
t 0,05 dengan derajad bebas (n – k).
dimana :
n = jumlah sampel =20
k = jumlah variabel bebas dan bergantung = 4
karena uji dilakukan 2 sisi,maka t tabel dengan α 0,025.
t(0,025; 16) = 2,473
t hitung untuk variabel Kualitas (X1) = -3,070 (minus)
Karena t hitung < -t tabel, maka Ho ditolak, berarti pengaruh kualitas signifikan.
t hitung untuk variabel Produksi =4,478.
Karena t hitung > t tabel, maka Ho ditolak, artinya pengaruh kapasitas produksi terhadap
pendapatan perusahaan signifikan.
t hitung untuk variabel Promosi = 4,291.
Karena t hitung > t tabel, maka Ho ditolak, artinya promosi mempengaruhi kenaikan pendapatan
perusahaan secara signifikan.
INTERPRETASI
• Persamaan
Dengan melihat pada table coefficient kita dapatkan persamaan sebagai
berikut.
Y = 3,332 – 0,559X1 + 1,486X2 + 0,019X3
Dimana :
Y =Pendapatan perusahaan
X1 = Kualitas
X2 = Produksi
X3 = Promosi
• Dari persamaan di atas, bisa dikembangkan menjadi dua model regresi
sesuai dengan kualitas produksi.
• Kualitas Super (kode 1)
Y = 3,332 – 0,559X1 + 1,486X2 + 0,019X3
Y = 3,332 – 0,559(1) + 1,486X2 + 0,019X3
Y = 2,773 + 1,486X2 +0,019X3
• Kualitas Prima (kode 2)
Y = 3,332 – 0,559X1 + 1,486X2 + 0,019X3
Y = 3,332 – 0,559(2) + 1,486X2 + 0,019X3
Y = 2,214 + 1,486X2 +0,019X3
Soal Latihan
• Berikut data jenis kelamin, hasil produksi dan skor tes kecerdasan
dari 8 karyawan pabrik mainan anak-anak “Tackey”.
Hasil Produksi Jenis Kelamin Skor Tes
(lusin) (Y) Kecerdasan
30 Perempuan 6
49 Laki-laki 9
18 perempuan 3
42 Perempuan 8
39 Laki-laki 7
25 Laki-laki 5
41 Perempuan 8
52 Laki-laki 10