Anda di halaman 1dari 58

KORELASI DAN

REGRESI
KORELASI
• Analisis korelasi bertujuan untuk
mengetahui pola dan keeratan
hubungan antara dua atau lebih
variabel.
• “Correlation does not imply
causation”, atau korelasi tidak
mengisyaratkan kejadian sebab
akibat.
ARAH KORELASI

• Arah korelasi menunjukkan pola


gerakan variabel Y terhadap
gerakan variabel X. Terdapat tiga
arah korelasi, yaitu
1. Positive correlation.
2. Negative correlation.
3. Nihil correlation.
ARAH KORELASI
Contoh Hubungan Positif

15

10
Series1
Y

0
0 5 10 15
X
ARAH KORELASI
Contoh Hubungan Negatif
• Inverse Correlation (Negative
Correlation)
20

15

10 Series1
Y

0
0 5 10 15 20
X
KOEFISIEN KORELASI
• Koefisien korelasi sering dilambangkan dengan
huruf (r). Koefisien korelasi dinyatakan dengan
bilangan, bergerak antara 0 sampai +1 atau 0
sampai -1.

• Notasi positif (+) atau negatif (-) menunjukkan arah


hubungan antara kedua variabel.
Notasi positif (+) berarti hubungan antara kedua
variabel searah (positive correlation), jika variabel
satu naik maka variabel yang lain juga naik.
Notasi negatif (-) berarti kedua variabel
berhubungan terbalik (negative correlation),
artinya kenaikan satu variabel akan dibarengi
dengan penurunan variabel lainnya.
KOEFISIEN KORELASI
• Jika nilai r > 0, artinya telah terjadi hubungan yang linier positif
(positive correlation), yaitu makin besar nilai variabel X makin
besar pula nilai variabel Y, atau makin kecil nilai variabel X makin
kecil pula nilai variabel Y.

• Jika nilai r < 0, artinya telah terjadi hubungan yang linier negative
(negative correlation), yaitu makin besar nilai variabel X makin
kecil nilai variabel Y, atau makin kecil nilai variabel X maka makin
besar pula nilai variabel Y.

• Jika nilai r = 0, artinya tidak ada hubungan sama sekali antara


variabel X dan variabel Y.

• Jika nilai r = 1 atau r = -1, maka dapat dikatakan telah terjadi


hubungan linier sempurna, berupa garis lurus, sedangkan untuk r
yang makin mengarah ke arah angka 0 (nol)maka garis makin
tidak lurus.
KORELASI PRODUCT MOMENT
• Analisis korelasi Pearson digunakan untuk
jenis statistik parametrik.

• Beberapa asumsi yang digunakan apabila


dilakukan analisis korelasi product moment
atau korelasi Pearson,antara lain :
1.Distribusi nilai dari variabel berdistribusi
normal atau mendekati normal.
2. Dua variabel yang akan dicari korelasinya
adalah variabel kontinu yang bersifat
rasional atau minimal bersifat interval.
3. Hubungan dari kedua variabel yang akan
dikorelasikan adalah linier.
Contoh :
Berikut data umur domba produktif, dengan produksi susu
yang diteliti. Hasil penelitian sebagai berikut :
Umur Susu
(Bulan) (Mili liter)
11 1410
10 1320
18 1700
19 1720
12 1500
13 1550
20 1890
15 1550
16 1600
17 1620
14 1580
Langkah-langkah SPSS adalah sebagai berikut :

1. Entrilah data ke lembar kerja SPSS.


2. Klik Analyze, Correlate, Bivariate.
 Pindahkan variabel umur dan susu ke
kolom Variables, pada Correlation
Coefficients, pilih Pearson.
 Test of Significance, pilih Two-tailed.
 Aktifkan Flag significant
correlations, ini berguna untuk
menampilkan tanda apabila hasilnya
signifikan.
Langkah-langkah SPSS
3. Klik Options. Aktifkan pilihan
Means and Standard deviations.
4. Klik Continue, OK.
OUTPUT
Descriptive Statistics

Mean Std. Deviation N


umur 15.00 3.317 11

susu 1585.45 153.777 11

Correlations
umur susu
umur Pearson Correlation 1 .951**

Sig. (2-tailed) .000


N 11 11
susu Pearson Correlation .951** 1

Sig. (2-tailed) .000


N 11 11
**. Correlation is significant at the 0.01 level (2-tailed).
INTERPRETASI
• Angka koefisien korelasi adalah 0,951, sangat
signifikan artinya hubungan antara umur dengan
susu sangat erat. Koefisien korelasi bertanda positif
(+) artinya terdapat hubungan antara umur dengan
susu sangat erat. Koefisien korelasi bertanda positif
(+) artinya terdapat hubungan positif antara umur
domba dengan produksi susu, semakin tua domba
pada umur produktif maka produksi susu juga
meningkat.

• Tanda ** menunjukkan bahwa koefisien korelasi


tersebut signifikan pada taraf kepercayaan 99%.
Kalau tanda bintangnya hanya satu (*) menunjukkan
signifikan pada level kepercayaan 95%.
Soal Latihan
• Berikut ini data mengenai hubungan antara hasil
penjualan dan biaya iklan dari sebuah perusahaan.
Biaya Iklan Biaya Penjualan
(juta Rp) (juta Rp)
0.50 5.00
1.00 10.00
1.75 12.50
2.50 20.00
3.25 30.00
4.00 35.00
5.50 40.00
5.75 42.50
6.50 50.00
(a) Buatlah diagram pencar dari data-data tersebut!
(b) Dengan menggunakan korelasi Pearson, carilah
nilai korelasi dan tentukan jenisnya!
KORELASI RANK SPEARMAN

• Metode ini mengukur keeratan


hubungan berdasarkan ranking dari
masing-masing data sehingga disebut
rank correlation coefficient.

• Sebelum dianalisis, terlebih dahulu


data disusun berdasarkan ranking
terhadap data lain.
Contoh :
Akan diteliti hubungan antara tinggi semai (cm) dengan
jumlah helai daun (helai) pada suatu persemaian.
No. Tinggi Daun
1 10 3
2 12 6
3 20 11
4 22 14
5 16 10
6 24 15
7 18 9
8 28 21
9 20 12
10 17 5
11 19 10
12 24 13
13 15 8
14 27 18
15 12 8
Penyelesaian dengan SPSS :

1. Entrilah data ke lembar kerja


SPSS.
2. Klik Analyze, Correlate, Bivariate
3. Pindahkan variabel tinggi dan
daun ke kolom Variables pada
Correlation Coefficients pilih
Spearman.
4. Klik OK.
OUTPUT
Correlations

tinggi daun
Spearman's rho tinggi Correlation 1.000 .943**
Coefficient

Sig. (2-tailed) . .000

N 15 15

daun Correlation .943** 1.000


Coefficient

Sig. (2-tailed) .000 .

N 15 15

**. Correlation is significant at the 0.01 level (2-tailed).


INTERPRETASI
• Koefisien korelasi antara tinggi dengan
jumlah daun adalah 0.943, biasanya
angka yang mendekati nilai 1 atau (-1)
berarti sangat signifikan.

• Tanda ** menunjukkan bahwa koefisien


korelasi tersebut signifikan pada taraf
kepercayaan 99%. Nilai 0,943 (positif),
artinya bahwa semakin tinggi semai akan
mempunyai jumlah daun yang lebih
banyak (positive correlation).
Soal Latihan
• Berikut ini data mengenai nilai matematika
dan statistika dari 10 mahasiswa.
Mat 82 75 85 70 77 60 63 66 80 89

Stat 79 80 89 65 67 62 61 68 81 84

(a) Hitunglah koefisien korelasi ranknya


(dengan korelasi Spearman)!
(b) Sebutkan jenis korelasinya dan apa artinya!
REGRESI
• Analisis regresi menjadi sangat terkenal dan
banyak digunakan karena ada beberapa yang
istimewa di dalam analisis regresi, di antaranya :
• Di dalam analisis regresi sudah termasuk
analisis korelasi antara variabel independen (X)
yang juga sering disebut faktor-faktor penyebab,
dengan variabel dependen (Y).
• Selanjutnya dengan persamaan regresi yang
didapat kita bisa membuat peramalan apa yang
akan terjadi dengan Y apabila terjadi perubahan
pada X, sebaliknya jika kita menginginkan nilai Y
tertentu, kita dapat mengestimasi seberapa
besar faktor-faktor X akan diubah untuk
mewujudkan tujuan kita.
ASUMSI DALAM REGRESI
Beberapa asumsi yang harus dipenuhi dalam
melakukan analisis regresi adalah :
1. Variabel random diasumsikan independen terhadap X.
Artinya bahwa nilai kovarian adalah nol antara variabel
independen dan tingkat kesalahan yang berhubungan
untuk tiap pengamatan.
2. Variasi random diasumsikan terdistribusi secara normal.
Artinya bahwa untuk masing-masing variabel
independen kesalahan dari prediksi diasumsikan
terdistribusi normal.
3. Variabel random diasumsikan memiliki varian yang
terbatas.
4. Rata-rata variabel random sama dengan nol.
5. Kesalahan prediksi terhadap X tidak bergantung dari
masing-masing variabel X.
6. Variabel-variabel independen tidak saling berkorelasi.
7. Jumlah data harus lebih besar dari jumlah variabel.
REGRESI LINIER SEDERHANA

Disebut regresi sederhana karena analisis ini hanya


berkaitan dengan dua variabel saja, satu disebut variabel
independen atau variabel bebas, biasanya diberi notasi X,
sedangkan variabel satunya disebut sebagai variabel
dependen atau variabel bergantung yang biasa diberi
notasi Y.

Regresi linier sederhana mengikuti persamaan di bawah ini :


Y = a + bX + e

Dimana :
Y = merupakan variabel bergantung (dependent variable)
X = sebagai variabel bebas (independent variable)
a = sebagai konstanta regresi
b = slope atau kemiringan garis regresi
e = error
Contoh :
Sebuah perusahaan yang bergerak di bidang perikanan sedang
menganalisis tingkat keasinan atau salinitas tambak dengan
produktivitas tambaknya, data-datanya sebagai berikut :
No. Salinitas (mmgram/liter) (X) Produksi (ton) (Y)
1 250 69
2 300 71
3 400 78
4 100 50
5 250 65
6 270 70
7 180 57
8 415 80
9 300 77
10 435 82
11 350 78
12 200 58
13 275 62
14 250 53
15 325 75
16 270 73
PENYELESAIAN DENGAN
SPSS
1. Entrilah data ke lembar kerja SPSS.
2. Klik Variable View di pojok kiri bawah.
3. Pada kolom Name isikan sesuai dengan nama
variabelnya, variabel pertama diberi nama Salinitas
dan variabel kedua diberi nama Produksi.
4. Klik Analyze, Regression, Linear.
5. Pindahkan variabel Salinitas sebagai variabel
bebas ke kolom independent(s), dan variabel
Produksi sebagai variabel tergantung ke kolom
dependent.
6. Klik menu Statistics, tandai Estimates,
Confidence intervals, Model fits dan
Descriptives. Kemudian klik Continue.
PENYELESAIAN DENGAN
SPSS
Pada kotak Regression Coefficients terdapat beberapa item
yaitu :
1. Estimates, berguna untuk memperkirakan hasil analisis
regresi. Jika pilihan ini tidak diaktifkan, koefisien regresi tidak
akan ditampilkan sehingga kita sulit membuat persamaan
regresinya.
2. Confidence intervals, merupakan interval taraf kepercayaan
dari persamaan regresi yang didapat. Pada interval taraf
kepercayaan akan ditampilkan lower bound dan upper bound
kurva normal.
3. Covariance matrix, akan menampilkan matrik varian/kovarian.
4. Model fit, akan menampilkan analisis regresi yang disertakan
analisis varian atau uji F regresi. Uji F ini berguna untuk
mengetahui semua variabel independen (variabel bebas) yang
berpengaruh terhadap variabel dependen (variabel
bergantung).
PENYELESAIAN DENGAN SPSS
7. Klik Options.
• Use probability of F digunakan untuk menentukan taraf
kesalahan berapa variabel independen yang akan dikeluarkan dari
persamaan dan taraf kesalahan berapa variabel independen yang
akan dimasukkan dalam persamaan. Pada kondisi default,
variabel independen akan masuk dalam persamaan jika
kesalahannya kurang dari 0.05 (5%) dan dikeluarkan jika lebih dari
0.1 (10%).
• Use F value juga digunakan untuk menentukan taraf kesalahan
berapa variabel independen yang akan dikeluarkan dari
persamaan dan taraf kesalahan berapa variabel independen yang
akan dimasukkan dalam persamaan. Kalau pada Use probability
of F, angka yang digunakan adalah angka probabilitas, Use F
value menggunakan nilai F pada tabel.
• Include constant in equation digunakan untuk menampilkan
konstanta persamaan garis regresi.
8. Pada pilihan Missing Values pilih Replace with mean artinya
data-data yang hilang digantikan dengan rata-rata.
9.Klik Continue, OK
OUTPUT
Descriptive Statistics

Mean Std. Deviation N


Produksi 68.63 10.059 16

Salinitas 285.63 87.785 16

Tabel Descriptive Statistics


Produktivitas tambak rata-rata = 68,63 ton
Salinitas/Kadar garam rata-rata = 285,63
Standar deviasi produktivitas = 10,059 ton
Standar deviasi kadar garam = 87,785
n (jumlah seluruh data) = 16 data
OUTPUT
Correlations
Produksi Salinitas
Pearson Correlation Produksi 1.000 .891
Salinitas .891 1.000
Sig. (1-tailed) Produksi . .000
Salinitas .000 .
N Produksi 16 16
Salinitas 16 16

Tabel Correlation
Korelasi Pearson (Pearson Correlation) = 0,891
Nilai 0,891 adalah nilai r hitung. Angka tersebut menunjukkan terjadi korelasi yang
sangat kuat antara kadar garam dengan produktivitas udang di tambak. Hubungan
bersifat positive correlation, artinya penambahan kadar garam akan menambah
produktivitas udang.

Sig (1-tailed) atau probabilitas = 0,000


Untuk mengetahui apakah nilai r hitung tersebut signifikan atau tidak, maka perlu
dibandingkan dengan r tabel atau dengan melihat probabilitasnya. Korelasi dikatakan
signifikan, jika r hitung lebih besar dari r tabel (r hitung > r tabel) atau nilai probabilitas
kurang dari taraf kesalahan (0,05). Terlihat probabilitasnya 0,000 < taraf signifikansi
0,05,berarti menunjukkan korelasi/hubungan yang signifikan.

n atau jumlah yang dianalisis = 16


OUTPUT
Variables Entered/Removedb

Model Variables Entered Variables Removed Method


1 Salinitas a
. Enter
a. All requested variables entered.
b. Dependent Variable: Produksi

Model Summary

Adjusted R Std. Error of the


Model R R Square Square Estimate
1 .891
a
.793 .779 4.732

a. Predictors: (Constant), Salinitas


INTERPRETASI
Tabel Variables Enteres/Removed
• Variables Entered (variabel yang masuk persamaan).
Variabel independen akan dimasukkan dalam persamaan berdasarkan kriteria Use Probability of F Entry 0,05
dan Removal 0,10. Dari hasil analisis, dapat dilihat bahwa variabel salinitas memenuhi syarat sehingga
dimasukkan dalam persamaan.
• Variables Removed (variabel yang dikeluarkan dalam persamaan). Dapat dilihat tidak ada variabel predictor yang
dikeluarkan.
• Method (metode) merupakan pilihan metode yang digunakan dalam hal ini yaitu metode Enter. Sebenarnya masih
terdapat beberapa metode lain, tetapi akan lebih relevan jika metode-metode tersebut dibahas dalam bagian
regresi berganda.
Tabel Model Summary
• Salah satu tabel yang mempunyai arti sangat penting dalam analisis regresi adalah Tabel Model Summary, karena
menyangkut nilai koefisien korelasi dan koefisien determinasi.
• R disebut juga dengan koefisien korelasi.
Nilai R menerangkan tingkat hubungan antara variabel independent (X) dengan variabel dependent (Y). Dari hasil
analisis didapat nilai koefisien korelasi sebesar 0,891, berarti bahwa hubungan antara salinitas dan produksi adalah
sebesar 89,1% (pada tabel ini tidak dituliskan nilai korelasi tersebut positif atau negatif).
• R Square disebut koefisien determinasi.
Koefisien determinasi menerangkan seberapa variasi Y yang disebabkan oleh x. Dari tabel dapat dibaca nilai R
square (R2) sebesar 0,793, artinya bahwa variasi yang terjadi terhadap banyak produktivitas tambak sebesar 79,35
disebabkan oleh variasi kadar garam di tambak dan sisanya hanya sebesar 20,7% dipengaruhi oleh hal-hal lain di
luar persamaan ini.
• Adjusted R square merupakan nilai R2 yang disesuaikan sehingga gambarannya lebih mendekati mutu penjajakan
model dalam populasi.
  n 1 
 
Adjusted R 2  1   1  R 2   
Dimana   n  k 
n = jumlah sampel
k = jumlah parameter

• Std. Error of the Estimation merupakan kesalahan standar dari penaksiran, bernilai 4,372.
OUTPUT

ANOVAb

Sum of Mean
Model Squares df Square F Sig. a
1 Regression 1204.308 1 1204.308 53.791 .000
Residual 313.442 14 22.389
Total 1517.750 15
a. Predictors: (Constant), Salinitas
b. Dependent Variable: Produksi
INTERPRETASI
Tabel Anova

Pada analisis kali ini kita menggunakan model regresi linier sederhana dengan model
persamaan Y = a + bX. Apakah pilihan model tersebut sudah tepat? Dapat diterima? Mengapa
tidak menggunakan model lain saja? Pertanyaan tersebut dijawab dengan melihat nilai F
hitung pada tabel ANOVA di atas. Dari hasil komputasi didapat nilai F hitung sebesar 53,791.
• Untuk menguji apakah model linier Y = a + bX tersebut sudah tepat atau belum, maka F
hitung pada tabel anova perlu dibandingkan dengan F tabel.
F hitung = 53,791
F tabel dilihat pada :
Taraf signifikansi 5%
-df pembilang = jumlah variabel – 1 = (2 – 1) = 1
-df penyebut = jumlah data – jumlah variabel = (16 – 2) = 14
F tabel = 4,60
Karena F hitung > F tabel, dapat disimpulkan bahwa model linier Y = a + bx sudah tepat dan
dapat digunakan.
• Selain membandingkan F hitung dengan F tabel ada cara yang lebih mudah untuk
menentukan ketepatan model di atas, yaitu dengan membandingkan probabilitas (pada tabel
Anova tertulis Sig) dengan taraf nyatanya (α = 0,05 atau 0,01).
Jika probabilitas > 0,05 maka model ditolak.
Jika probabilitas < 0,05 maka model diterima.
• Dapat dilihat nilai probabilitas (Sig) adalah 0,000 < 0,05 berarti model diterima atau dapat
disimpulkan bahwa bentuk persamaan linier Y = a + bX sudah tepat dan dapat
dipertanggungjawabkan.
OUTPUT
Coefficientsa

Standar
dized 95.0%
Unstandardized Coeffici Confidence
Coefficients ents Interval for B

Std. Lower Upper


Model B Error Beta t Sig. Bound Bound
1 (Const 39.471 4.147 9.51 .000 30.576 48.366
ant) 7
Salinit .102 .014 .891 7.33 .000 .072 .132
as 4
a. Dependent Variable: Produksi

INTERPRETASI
Tabel Coefficients
Kolom Unstandardized Coefficients
Constant (Konstanta) = 39,471
Konstanta untuk X (salinitas) = 0,102
Dari sini didapatkan persamaan regresi Y = 39,471 + 0,102X
• Kolom t
Uji t berguna untuk menguji signifikansi koefisien regresi (b), apakah variabel independent (X)
berpengaruh secara nyata atau tidak.
• Hipotesis
Ho = kadar garam tidak berpengaruh nyata terhadap produktivitas tambak.
Ha = kadar garam mempengaruhi produktivitas tambak.
• Pengambilan Keputusan
Jika –t tabel < t hitung < t tabel, maka Ho diterima.
Jika t hitung < -t tabel atau t hitung > t tabel, maka Ho ditolak.
t hitung sebesar 7,334
t tabel tingkat signifikansi 0,05
derajad bebas = jumlah sampel – jumlah variabel = (16 – 2) = 14 dimana dilakukan 2 sisi
(2 tailed)
t tabel (0.05; 14) = 2,510
Karena t hitung > t tabel maka Ho ditolak, artinya bahwa kadar garam berpengaruh secara
nyata (signifikan) terhadap produktivitas tambak.
Pengambilan keputusan juga dapat dengan melihat probabilitasnya dimana nilainya
0,000 < 0,05.
Soal Latihan
• Berikut ini data mengenai pengalaman kerja dan
penjualan.
X : pengalaman kerja (tahun)
Y : omzet penjualan (ribuan)
X 2 3 2 5 6 1 4 1
Y 5 9 8 7 11 3 10 4

(a) Apakah pengalaman kerja berpengaruh secara


signifikan terhadap omzet penjualan?
(b) Tentukan nilai a dan b serta tentukan persamaan
regresinya!
(c) Berapa omzet penjualan dari seorang karyawan
yang pengalaman kerjanya 3,5 tahun?
REGRESI LINIER BERGANDA

• Membahas hubungan antara satu variabel dependen


dengan beberapa variabel independen atau yang sering
disebut sebagai regresi berganda. Dinamakan berganda
bukan berarti variabel bebasnya berjumlah dua, tetapi bisa
berjumlah dua atau lebih.
• Rumus matematis untuk regresi berganda adalah sebagai
berikut :
Y = a +b1X1 + b2X2 + b3X3 + … + bnXn
Atau secara lengkap dapat juga ditulis sebagai berikut :
Y = a +b1X1 + b2X2 + b3X3 + … + bnXn + e
• Dimana :
Y = variabel dependen (bergantung)
a = koefisien/konstanta regresi
b1,2,3 = koefisien untuk variabel X1, X2, X3 dan seterusnya
X1,2,3 = variabel independen pertama, kedua, ketiga dan
seterusnya.
e = error
Contoh :
Faktor utama yang mempengaruhi produktivitas padi tadah hujan
adalah curah hujan dan dosis pemupukan. Berbasis data yang telah
dikumpulkan, seseorang ingin mengetahui seberapa besar curah
hujan dan pemupukan berpengaruh terhadap produktivitas padi.
PRODUKSI PADI (KUINTAL) CURAH HUJAN (mm/hari) PEMUPUKAN (kg/ha)
(Y) (X1) (X2)
24 80 30
21 75 20
28 120 30
22 60 27
28 110 32
27 105 31
26 80 28
28 110 37
34 150 43
30 100 40
25 83 30
27 97 33
15 42 15
22 70 20
25 75 28
PENYELESAIAN DENGAN SPSS
1. Entrilah data dalam lembar kerja SPSS.
2. Klik Variable View di sebelah kiri bawah
lembar kerja.
3. Kolom label digunakan untuk memperjelas
informasi tentang variabel yang dimaksud.
Pada kolom Label, berilah nama produktivitas
untuk variabel Y, curah hujan untuk X1, dan
pemupukan untuk X2.
4. Klik Analyze, Regression, Linear.
Pindahkan variabel produktivitas (Y) sebagai
variabel bergantung ke kolom Dependent serta
variabel curah hujan (X1) dan pemupukan (X2)
sebagai variabel bebas ke kolom
Independent(s).
Perhatikan pada kolom Method.
Menu ini merupakan menu pilihan metode regresi yang hendak digunakan,
terdapat beberapa metode yang disajikan dalam SPSS, yaitu :
1. Metode Enter
Adalah metode analisis biasa dimana semua variabel bebas dimasukkan
sebagai variabel prediktor, tidak memandang pengaruh apakah variabel
tersebut berpengaruh besar atau kecil pada variabel bergantung
(kriterium).
2. Metode Stepwise
Digunakan untuk analisis regresi secara bertahap dengan tujuan pokok
untuk mencari variabel yang paling dominan.
3. Metode Remove
Digunakan untuk mencari prediktor yang dominan dan bila variabel
prediktor tidak berpengaruh, akan dibuang(di-remove).
4. Metode Backward
Menganalisis variabel dari belakang, artinya semua variabel dianalisis
kemudian dilanjutkan menganalisis pengaruh variabel-variabel bebasnya
lalu variabel yang tidak berpengaruh dibuang.
5. Metode Forward
Menganalisis variabel dari depan, maksudnya semua variabel
pertamanya dianggap tidak berpengaruh semua, kemudian variabel yang
berpengaruh dimasuk-masukkan.
PENYELESAIAN DENGAN SPSS
5. Klik Options
a)Use Probability of F menunjukkan nilai probabilitas dimana sebuah
variabel akan dimasukkan dalam persamaan atau dikeluarkan dari
persamaan harga entry di sini adalah 0,05. Artinya, jika nilai probabilitas
X1 atau X2 kurang dari 0,05, akan dimasukkan dalam persamaan. Harga
removal 0,1 artinya jika nilai probabilitas X1 dan X2 lebih dari 0,1, variabel
tersebut akan dikeluarkan dari persamaan.
b)Use F Value, jika memilih opsi ini, Anda harus memasukkan harga entry
dan harga removal. Nilai entry harus lebih besar daripada nilai removal.
Dalam keadaan default, harga entry = 3,84 dan harga removal 2,71.
c)Exclude cases listwise menganalisis case-case yang hanya memiliki
harga valid dari semua variabel.
d)Exclude cases pairwise menganalisis koefisien korelasi dari seluruh case
yang berharga valid dari semua variabel yang dikorelasikan.
e)Replace with mean menggantikan missing value dengan rata-rata
variabel.
6. Pilih probabilitas entry 0,05 dan harga removal 0,1; exclude case listwise,
kemudian klik Continue.
7. Klik Statistic.
8. Aktifkan kotak estimates dan model fit, abaikan yang lain,klik continue.
9. Klik OK.
OUTPUT

Variables Entered/Removedb

Model Variables Entered Variables Removed Method


1 pemupukan , curah . Enter
hujan

a. All requested variables entered.


b. Dependent Variable: produktivitas

Model Summary

Std. Error of the


Model R R Square Adjusted R Square Estimate
1 .975a .951 .942 1.061

a. Predictors: (Constant), pemupukan , curah hujan

ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 260.229 2 130.115 115.620 .000a
Residual 13.504 12 1.125
Total 273.733 14
a. Predictors: (Constant), pemupukan , curah hujan
b. Dependent Variable: produktivitas

Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 8.754 1.164 7.523 .000
curah hujan .078 .019 .470 4.064 .002
pemupukan .327 .069 .548 4.741 .000
a. Dependent Variable: produktivitas
INTERPRETASI
• Tabel Variables Entered/Removed
Tabel ini memberikan informasi tentang variabel-variabel independen
yang kurang berpengaruh terhadap variabel dependen sehingga
akan dikeluarkan dari persamaan. Dapat dilihat pada kolom
variables removed tidak terdapat variabel yang dikeluarkan.
• Tabel Model Summary
 Menerangkan besarnya korelasi (R), koefisien determinasi (R 2),
koefisien determinasi yang disesuaikan (adjusted R 2) dan standar
error.
 Koefisien korelasi (R) sebesar 0,975, mendekati nilai1 artinya
hubungan antara variabel-variabel independen (X 1, X2) dan
dependen (Y) sangat erat. Korelasi antara variabel dependen dan
independen bersifat positif. Artinya, jika nilai X naik, maka akan
direspon dengan kenaikan nilai Y.
 Koefisien determinasi (R2) sebesar 0,951, artinya bahwa 95,1%
produksi padi tadah hujan dipengaruhi oleh faktor curah hujan dan
pemupukan. Sedangkan 4,9% (100% - 95,1%) karena faktor-
faktor lain yang tidak dapat dijelaskan dalam persamaan regresi
tersebut.
 Koefisien determinasi dapat dihitung dengan mengkuadratkan
koefisien korelasi.
INTERPRETASI
• Tabel ANOVA
Persamaan regresi yang kita gunakan adalah :
Y = a + b1X1 + b2X2
Apakah model hubungan antara X1, X2 dan Y hanya ada model linier seperti di
atas? Jelas tidak, sebenarnya model-model persamaan masih sangat banyak.
Jadi, mengapa kita menggunakan persamaan linier? Apakah model tersebut
sesuai? Pertanyaan tersebut akan terjawab dari tabel ANOVA.
F hitung digunakan untuk menguji apakah model persamaan
Y = a + b1X1 + b2X2 yang diajukan dapat diterima atau tidak.
Caranya dengan membandingkan F hitung tersebut dengan F tabel.
Jika F hitung > F tabel, maka model di atas dapat diterima dan sebaliknya.
-F hitung = 115,62
-F tabel dapat dilihat pada α = 0,05 dengan
Derajad bebas pembilang = (k – 1)= 3 – 1 = 2
Derajad penyebut = (n – k) = 15 – 3 = 12
-F tabel 0,05 (2;12) = 3,89
Karena F hitung > F tabel, dapat disimpulkan bahwa model yang digunakan
sudah tepat.
Untuk lebih mudahnya dapat dengan melihat probabilitasnya. Jika probabilitas
< taraf signifikansi (α =0,05),maka model diterima. Dan sebaliknya, dapat
dilihat probabilitasnya adalah 0,000 < 0,05 maka model persamaan Y = a +
b1X1 + b2X2 yang digunakan dapat diterima.
INTERPRETASI
• Tabel Coefficients
Setelah menguji signifikansi persamaan regresi, selanjutnya perlu diuji apakah
masing-masing variabel independen (X1, X2) mempunyai pengaruh yang nyata
terhadap Y. Untuk itu dilakukan uji t.
• Hipotesis :
Ho : Variabel independen tidak mempengaruhi variabel dependen secara nyata.
Ha : Variabel bebas berpengaruh nyata terhadap variabel dependen.
• Pengambilan Keputusan :
Jika –t tabel < t hitung < t tabel, Ho diterima.
Jika t hitung < -t tabel atau t hitung > t tabel, Ho ditolak.
t tabel dilihat dengan derajad bebas = n – k
n = jumlah sampel dalam hal ini = 15
k = jumlah variabel yang digunakan = 3
sehingga derajad bebasnya = 15 – 3 = 12
Uji t dilakukan uji dua arah (2 tailed) sehingga cara membaca t tabelnya sedikit
berbeda, t tabel dibaca pada t ½ α atau t ½ (0,05) atau t 0,025.
-t tabel = 2,560
-t hitung (X1) =4,062
-t hitung (X2) = 4,741
INTERPRETASI
• Keputusan :
• Variabel Curah Hujan (X1)
Karena t hitung (4,062) > t tabel
(2,560) maka Ho ditolak, artinya curah
hujan berpengaruh nyata terhadap
produktivitas padi.
• Variabel Pemupukan (X2)
Karena t hitung (4,741) > t tabel
(2,560) maka Ho ditolak, artinya
produktivitas dapat dipengaruhi secara
nyata oleh faktor pemupukan.
INTERPRETASI

Persamaan regresi dapat diperoleh pada kolom B pada tabel coefficients.


Baris pertama menunjukkan konstanta (a), baris kedua adalah konstanta
untuk faktor X1, dan baris ketiga adalah konstanta untuk faktor X2.
Persamaan dasarnya adalah :
Y = a + b1X1 + b2X2
Dengan melihat hasil pada tabel coefficients,maka :
Persamaan regresi Y = 8,754 + 0,078X1 + 0,327X2
Dimana ;
Y = Produksi Padi
X1 = Curah Hujan
X2 = Pemupukan
Dari persamaan dapat diuraikan sebagai berikut :
1. Konstanta (a) = 8,754, artinya jika padi tidak dilakukan pemupukan
dan tidak ada hujan, produksi padi adalah 8,754 kuintal.
2. Koefisien regresi X1 (b1) = 0,078, artinya jika terjadi curah hujan
sebanyak 1 satuan, produksi padi akan meningkat sebesar 0,078
kuintal.
3. Koefisien regresi X2 (b2) = 0,327, artinya jika padi dipupuk sebesar 1
satuan, produksi padi meningkat sebesar 0,325 kuintal.
Soal Latihan
• 12 orang mahasiswa di Jakarta ditanya tentang berat badan,
tinggi dan umur mereka.
Y = berat badan dalam kg.
X1 = tinggi dalam cm.
X2 = umur, dibulatkan dalam tahun.
Hasil wawancara adalah sbb.
Y 64 71 53 67 55 58 77 57 56 51 76 58
X1 157 159 149 162 151 150 155 148 152 142 161 157
X2 18 20 16 21 18 17 20 19 20 16 22 19

(a) Carilah nilai a, b1 dan b2 serta tentukan persamaan regresi


berganda!
(b) Apakah tinggi dan umur masing-masing berpengaruh
signifikan terhadap berat badan?
(c) Berapa berat seseorang yang tingginya 153 cm dan umurnya
23 tahun?
REGRESI LINIER DENGAN VARIABEL BONEKA
(DUMMY VARIABLE)
• Dalam menganalisis data, terkadang kita dihadapkan pada data-data
yang bukan data rasio tetapi berupa data-data kategori yang bersifat
kualitatif. Data-data kategori misalnya jenis
kelamin,pekerjaan,pendidikan dan lain-lain. Jenis kelamin kita hanya
mempunyai dua laki-laki atau perempuan, pendidikan misalnya
dibedakan menjadi SD, SMP, SMA dan sarjana, data-data tersebut
bukan data yang berbentuk angka dan tidak mempunyai nilai
kuantitatif.
• Analisis regresi tidak serta merta dapat menganalisis data-data
semacam ini. Untuk menganalisis data-data kategori,maka data-data
tersebut harus “diangkakan” sehingga mempunyai nilai. Misalnya
untuk variabel jenis kelamin, laki-laki diberi angka 1 sedangkan
perempuan diberi angka 0. Angka 1 dan angka 0 tersebut bukan
merupakan nilai sebenarnya, angka tersebut hanya berupa kategori
sehingga disebut sebagai variabel boneka atau dummy.
• Regresi dummy digunakan dalam persamaan regresi dimana variabel
independennya (X) berupa variabel kualitatif. Sebaliknya, jika yang
merupakan variabel kualitatif adalah variabel dependennya (Y),
regresi yang digunakan adalah regresi logistik.
Contoh :
Perusahaan Silva Wood Industries, merupakan produsen bubur kertas (pulp). Selama bertahun-
tahun perusahaan telah memproduksi pulp dengan kualitas “prima” Perusahaan telah berhasil
meningkatkan kualitas produksi menjadi kualitas “super”. Dengan kekuatan promosi perusahaan
telah merambah dunia ekspor. Perusahaan hendak mengetahui peranan kualitas, produksi dan
promosi di dalam meningkatkan pendapatan perusahaan. Data-datanya sebagai berikut.
Kualitas Produksi (Ton) Promosi (Juta Rupiah) Pendapatan (milyar Rupiah)
Super 1.55 61.7 6
0.85 61.7 5.4
0.9 74.1 5.6
1.19 74.1 5.5
1.4 49.4 5.6
0.9 49.4 4
1.3 61.7 5.7
1.2 86.4 5.6
1.1 74.1 5.6
0.7 49.4 4.4
1.2 74.1 5.6
Prima 0.9 49.4 4.3
0.8 49.4 4.4
1.2 74.1 5.6
0.9 49.4 4.6
0.99 37 4.4
1.2 49.4 4.7
0.99 49.4 4.2
1.3 98.9 5.6
1.2 86.4 5.6
PENYELESAIAN DENGAN SPSS
1. Entrilah data ke halaman kerja SPSS dengan format
sebagai berikut.
2. Klik Variable View pada pojok kiri bawah.
3. Beri nama dan label untuk masing-masing variabel :
Baris pertama : nama X1, Label : Kualitas
Baris kedua : nama X2, Label : Produksi
Baris ketiga : nama X3, Label : Promosi
Baris keempat : nama Y, Label : Pendapatan
4. Khusus pada variabel X1, karena variabel tersebut
merupakan variabel kategori, artinya angka 1
tersebut bukan benar-benar sebagai angka satu
melainkan hanya kode untuk kualitas super dan
angka dua untuk kualitas prima, maka variabel X1
perlu diberi keterangan sebagai berikut.
PENYELESAIAN DENGAN SPSS
5. Pada bagian kolom Value :
Keterangan pada variabel X1 (Kualitas) :
-Super diberi kode 1
-Prima diberi kode 2
6. Klik Analyze, Regression, Linear.
7. Pindahkan variabel Pendapatan (Y) ke
kolom Dependent, variabel Kualitas
(X1), Produksi (X2) dan Promosi (X3)
ke kolom Independent(s).
8. Klik OK.
OUTPUT
Variables Entered/Removedb
Model Variables Entered Variables Removed Method
1 Promosi, Kualitas, . Enter
Produksi
a. All requested variables entered.
b. Dependent Variable: Pendapatan

Model Summary
Std. Error of the
Model R R Square Adjusted R Square Estimate
1 .912 a
.831 .799 .28981
a. Predictors: (Constant), Promosi, Kualitas, Produksi

ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 6.608 3 2.203 26.225 .000a
Residual 1.344 16 .084
Total 7.952 19
a. Predictors: (Constant), Promosi, Kualitas, Produksi
b. Dependent Variable: Pendapatan

Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3.332 .503 6.622 .000
Kualitas -.559 .182 -.316 -3.070 .007
Produksi 1.486 .332 .507 4.478 .000
Promosi .019 .004 .487 4.291 .001
INTERPRETASI
Tabel Variables Entered/Removed
Semua variabel masuk di dalam kolom variables entered,artinya
semua variabel dimasukkan dalam persamaan dan tidak ada
variabel yang dikeluarkan.
 
Tabel Model Summary
Pada tabel ini dapat dilihat nilai koefisien korelasi (R) sebesar 0,912
menunjukkan hubungan yang sangat kuat. Koefisien determinasi
(R2) sebesar 0,831 artinya naik turunnya pendapatan perusahaan
83,1% disebabkan pengaruh Kualitas, Produksi dan Promosi.
Hanya 16,9% yang tidak diketahui.
Adjusted R Square merupakan koreksi dari R2 sehingga
gambarannya lebih mendekati mutu penjajakan model populasi. R 2
yang disesuaikan dirumuskan sebagai berikut :
 2  n  1 
Adjusted R 2
 
 1   1  R   
 nk 
Dimana
n = jumlah sampel
k= jumlah parameter
INTERPRETASI

• Tabel Anova
Dari tabel Anova dapat dilihat nilai F
hitung 26,265.
F tabel 0.05 (3;16) adalah 3,24.
Karena F hitung > F tabel atau melihat
probabilitasnya (Sig) yang lebih kecil dari
taraf signifikansi (0,000 < 0,05), dapat
disimpulkan bahwa model persamaan
Y = a + b1X1 + b2X2 + b3X3 yang diajukan
dapat diterima.
INTERPRETASI
• Tabel Coefficients
Dilakukan uji t untuk menguji signifikansi koefisien regresi dari setiap variabel independen.
• Hipotesis
Ho = Variabel bebas tidak berpengaruh nyata terhadap variabel dependen.
Ha = Variabel bebas berpengaruh nyata terhadap variabel dependen.
• Pengambilan Keputusan
Jika –t tabel < t hitung < t tabel, maka Ho diterima.
Jika t hitung < -t tabel atau t hitung > t tabel, maka Ho ditolak.
• Keputusan :
t tabel
t 0,05 dengan derajad bebas (n – k).
dimana :
n = jumlah sampel =20
k = jumlah variabel bebas dan bergantung = 4
karena uji dilakukan 2 sisi,maka t tabel dengan α 0,025.
t(0,025; 16) = 2,473
t hitung untuk variabel Kualitas (X1) = -3,070 (minus)
Karena t hitung < -t tabel, maka Ho ditolak, berarti pengaruh kualitas signifikan.
t hitung untuk variabel Produksi =4,478.
Karena t hitung > t tabel, maka Ho ditolak, artinya pengaruh kapasitas produksi terhadap
pendapatan perusahaan signifikan.
 
t hitung untuk variabel Promosi = 4,291.
Karena t hitung > t tabel, maka Ho ditolak, artinya promosi mempengaruhi kenaikan pendapatan
perusahaan secara signifikan.
INTERPRETASI
• Persamaan
Dengan melihat pada table coefficient kita dapatkan persamaan sebagai
berikut.
Y = 3,332 – 0,559X1 + 1,486X2 + 0,019X3
Dimana :
Y =Pendapatan perusahaan
X1 = Kualitas
X2 = Produksi
X3 = Promosi
• Dari persamaan di atas, bisa dikembangkan menjadi dua model regresi
sesuai dengan kualitas produksi.
• Kualitas Super (kode 1)
Y = 3,332 – 0,559X1 + 1,486X2 + 0,019X3
Y = 3,332 – 0,559(1) + 1,486X2 + 0,019X3
Y = 2,773 + 1,486X2 +0,019X3
• Kualitas Prima (kode 2)
Y = 3,332 – 0,559X1 + 1,486X2 + 0,019X3
Y = 3,332 – 0,559(2) + 1,486X2 + 0,019X3
Y = 2,214 + 1,486X2 +0,019X3
Soal Latihan
• Berikut data jenis kelamin, hasil produksi dan skor tes kecerdasan
dari 8 karyawan pabrik mainan anak-anak “Tackey”.
Hasil Produksi Jenis Kelamin Skor Tes
(lusin) (Y) Kecerdasan
30 Perempuan 6
49 Laki-laki 9
18 perempuan 3
42 Perempuan 8
39 Laki-laki 7
25 Laki-laki 5
41 Perempuan 8
52 Laki-laki 10

(a) Tentukan a,b1 dan b2 serta persamaan regresi linier berganda!


(b) Apakah jenis kelamin dan skor tes kecerdasan berpengaruh
secara signifikan terhadap hasil produksi?

Anda mungkin juga menyukai