Anda di halaman 1dari 28

TEORI DASAR

A. Pengertian Regresi dan Korelasi


1. Pengertian Regresi
Regresi adalah suatu metode analisis statistik yang digunakan untuk melihat
pengaruh antara dua atau lebih variabel. Hubungan variabel tersebut bersifat
fungsional

yang

diwujudkan

dalam

suatu

model

matematis.

(www.pengertianahli.com,2014)
Analisis regresi dalam statistika adalah salah satu metode untuk menentukan
hubungan sebab-akibat antara satu variabel dengan variabel(-variabel) yang
lain. Variabel "penyebab" disebut dengan bermacam-macam istilah:
variabel penjelas, variabel eksplanatorik, variabel independen, atau secara
bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai
absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang
dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua
variabel ini dapat merupakan variabel acak (random), namun variabel yang
dipengaruhi harus selalu variabel acak.
Analisis regresi adalah salah satu analisis yang paling populer dan luas
pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan
prediksi dan ramalan, dengan penggunaan yang saling melengkapi dengan
bidang pembelajaran mesin. Analisis ini juga digunakan untuk memahami
variabel bebas mana saja yang berhubungan dengan variabel terikat, dan
untuk mengetahui bentuk-bentuk hubungan tersebut. (www.usu.ac.id.2013)
2. Pengertian Korelasi
Analisis korelasi adalah alat statistik yag dapat digunakan untuk mengetahui
derajat hubungan linear antara satu variabel dengan variabel yang lain
(algifri,2000:45).

Umumnya

analisis

korelasi

digunakan,

dalam

hubungannya dengan analisis regresi, untuk mengukur ketepatan garis


regresi dalam menjelaskan(explaining)variasi nilai variabel dependent. Hasil

dari perhitungan korelasi diinterpretasikan pada sebuah hubungan yang


didasarkan pada nilai angka yang muncul.
Sandaran nilainya adalah ,-1 r 1. Semakin tinggi nilai koefisien korelasi
(semakin mendekati nilai 1) maka hubungannya antara dua varibel tersebut
semakin tinggi, jika nilai koefisiennya mendekati nilai 0 mka hubungnnya
semakin rendah. Adapun jika nilainya bertanda negatif, maka terjadi
hubungan yang berlawanan arah, artinya jika suatu nilai variabel naik maka
nilai variabel lain akan turun. (www.usu.ac.id.2013)
B. Jenis-jenis Regresi dan Korelasi beserta Rumus dan Contohnya Tiap
Jenis
1. Jenis-jenis Regresi Linear
a. Analisa Regresi Linear
Sebelum melakukan analisis korelasi dalam sebuah penelitian maka
terlebih dahulu harus diketahuai apakah variabel-variabel yang akan
dikorelasikan merupakan regresi linear atau non linear, karena hal ini
akan dipergunakan dalam menganalisa data. Yang dimaksud dengan
analis regresi linear adalah jika hubungan persamaan tersebut searah dan
membentuk sebuah pola garis lurus seperti gambar 2.1 berikut ini

Gambar 2.1 pola garis Lurus

Antara variabel bebas (X) dan variabel terikat (Y) membentuk sebuah
pola garis yang lurus, dan dalam aplikasinya jika nilai X meningkat maka
nilai Y juga meningkat dan jika nilai X mengalami penurunan makan
nilai Y juga mengalami penurunan.
Didalam teorinya analisa regresi linear mempunyai dua bentuk
persamaan yaitu:
1. Analisa regresi linear sederhana
Yang dimaksud dengan hubungan linear sederhana adalah yang
ditunjukkan dengan persamaan Y= a+ bX. Persamaan ini hanya
memiliki 2 variabel saja, hanya satu variabel terikat(Y) dan satu
variabel bebas (X) . Sehingga setiap nilai X bertambah dengan satu
satuan maka nilai Y akan bertambah dengan b. kalau nilai X=0 maka
nilai Y sebesar a saja.
Penggunaan model regresi sederhana hanya memungkinkan bila
pengaruh yang ada itu hanya dari independent variabel (variabel
bebas) terhadap dependent variabel (variabel terikat), tidak boleh ada
pengaruh timbal balik, yaitu jika variabel terikat juga berpengaruh
terhadap variabel bebas.
Dalam regresi linear sederhana dihindari sifat autokorelasi . yang
dimaksud dengan autokorelasi adalah hubungan antara nilai suatu
variabel dengan nilai variabel yang lain sama( Pangestu, 2004: 155).
Misalnya kalau pada tahun pembelian bak penampunagn air banyak
sekali, maka pembelian bak mandi 10 tahun lagi juga akan banyak,
karena usia bak air tersebut memang hanya bertahan 10 tahun. Yang
dibeli 10 tahun sebelumnya akan rusak, sehingga pemebelian secara
bersama-sama setiap 10 tahun sekali, sehingga pembelian akan
melonjak. Dengan kata lain ada hubunagn antara pembelian bak air
yang sama dengan pemeblian 10 tahun yang akan datang. Inilah yang
dimaksud adanya autokorelasi.
Ciri penting dari regresi sederhana adalah apabila terdapat
homoscedasticity. Homoscedasticity adalah kesamaan distribusi Y

pada setia nilai X. Artinya berapapun besarnya X, kalau diamati nilai


Y nya dan dihitung deviasi standartnya relative sama, misalnya jika
pada nilai X1 diamati nilai Y dan dicata deviasi satndartnya, dan
dibandingkan denagn nilai Y pada X2 maka nilainya sama, yang
berarti distribusi nilai Y terhadap nilai X selalu sama. gejala ini yang
dimaksud dengan homoscedasticity. Kalau distribusinya tidak sama
maka tidak boleh terjadi pada regresi linear sederhana.
Persamaan Y = a+ bX dalam teori regresi linear sederhana memili
makna sebagai berikut:
Y : variabel terikat
X : variabel bebas
a : konstanta
b : kemiringan
Contoh Kasus
Berikut adalah data Biaya Promosi dan Volume Penjualan PT BIMOIL
perusahaan Minyak Goreng
Tahun

1992
1993
1994
1995
1996

Biaya Promosi

Volume Penjualan

(Juta Rupiah)
2
4
5
7
8
x = 26

(Ratusan Juta Liter)


5
6
8
10
11
y = 40

10
24
40
70
88
xy =

4
16
25
49
64
x = 158

25
36
64
100
121
y =

232
346
bentuk umum persaman regresi linier sederhana : Y = a + b X
n=5

Nilai b adalah 1,05263 dibulatkan menjadi 1,053


n

yi
i 1

x
i 1

n
n n
n xi y i n xi n y i
i 1 i 1
b i 1
2
n
n

2
n xi n xi y
i 1
i 1

Nilai a =2,5263 dibulatkan menjadi 2,530


Jadi persamaan regresi linear sederhana adalah
Y=a+bX
Y=2,530 + 1,053 X
(susys.staff.gunadarma.ac.id, 2013)
2. Regresi Linear Berganda
Jika dalam regresi linear sederhana hanya memiliki 2 variabel saja
yaitu satu variabel terikat (Y) dan satu variabel bebas(X) dengan satu
predictor (a). Pada regresi linear berganda terdapat lebih dari 2
variabel, satu variabel untuk variabel terikat, dan lebih dari satu untuk
variabel tertutup.
Regresi berganda berguna untuk mencari pengaruh dua atu lebih
variabel bebas atau untuk mencari hubungan fungsional dua variabel
bebas atau lebih terhadap variabel terikatnya, atau untuk meramalkan
dua variabel bebas atau lebih terhadap variabel terikatnya. Dengan
demikinan multiple regression (regresi berganda) digunakan untuk
penelitian yang menyertakan bebarapa variabel sekaligus. Dalam hal
ini regresi juga dapat dijadikan pisau analisis terhadap penelitian yang
diadakan, tentu saja jika regresi diarahkan untuk menguji variabelvariabel yang ada.
Pada dasarnya rumus pada regresi ganda sama dengan rumus pada
regresi sederhana, hanya saja pada regresi berganda ditambahkan
variabel-variabel lain yang juga diikutsertakan dalam penelitian.
Adapun rumus yang dipakai disesuaikan dengan jumlah variabel yang
diteliti.
Rumus rumusnya adalah sebagai berikut :
Untuk 2 prediktor : Y= a + b1X1 + b2X2

Untuk 3 prediktor : Y= a + b1X1 + b2X2 + b3X3


Untuk n prediktor : Y= a + b1X1 + b2X2 + b3X3 bnXn
Pada dasarnya regresi berganda digunakan untuk menghitung dan atau
menguji tingkat signifikansi, antara lain:
a. Menghinung persamaan regresinya
b. Menguji apakah persamaan regresinya signifikan
c. Dan bagaimana kesimpulannya?
Contoh kasus :
Jika kita ingin mengukur faktor-faktor yang berpengaruh terhadap
penjualan

produk

mobil,

mungkin

faktor-faktor

yang

mempengaruhinya dapat berupa citra merk, layanan purna jual, harga


yang kompetitif, pengaruh lingkungan, iklan media, dan lain
sebagainya. Dari contoh tersebut, maka penjualan produk mobil
disebut variabel dependent, sedangkanvariabel lainnya merupakan
variabel independent.
Persamaan yang digunakan yaitu persamaan regresi berganda:

dimana:
y = penjualan produk mobil

X4 =pengaruh liingkungan

X1 = citra merk

X5 = iklan media

X2 = layanan purna jual

b = koefisien regresi

X3 = harga kompetitif

e = error

(skripsimahasiswa.blogspot.com,2010)

b. Regresi Non-linier
Regresi non-linier terbagi atas beberapa, antara lain:
1. Regresi Polinomial, merupakan bentuk regersi dengan variabel bebas
X yang memiliki fungsi berpangkat yang berurut.
Y = a + b1X1 + b2X22 + ... + bnXnm

Y
: variaber terikat
Xn : variabel bebas ke-n
a : konstanta
bn : kemiringan ke-n
Xnm : variabel bebas pangkat ke-m
Contoh:
Seorang peneliti ingin mengetahui hubungan antara dosis oba
tertentu (X) dengan kadar Creatinin Ginjal (Y) kelinci percobaan,
dari hasil peneitiannya diperoleh hasil sebagai berikut :
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Dosis Obat
1
2
3
4
5
7
3
2
4
6
7
8
8
1
3

Kadar Creatin
10
13
15
20
16
11
14
12
21
17
10
7
6
11
16

Jawab:
Kita tentukan dulu nilai yang perlu untuk regresi polinom
berderajat dua, yaitu:
No.
1
2
3
4
5
6
7
8
9

Dosis

Kadar

Obat (X)
1
2
3
4
5
7
3
2
4

Creatin (Y)
10
13
15
20
16
11
14
12
21

X^2

X^3

X^4

XY

X^2Y

1
4
9
16
25
49
9
4
16

1
8
27
64
125
343
27
8
64

1
16
81
256
625
2401
81
16
256

10
26
45
80
80
77
42
24
84

10
52
135
320
400
539
126
48
336

10
11
12
13
14
15
Jumlah

6
17
36
216
1296
102
7
10
49
343
2401
70
8
7
64
512
4096
56
8
6
64
512
4096
48
1
11
1
1
1
11
3
16
9
27
81
48
64
199
356
2278
15704
803
dari table diatas kita memperoleh persamaan normal:

Setelah

persamaan

simultan

ini

diselesaikan,
,

612
490
448
384
11
144
4055

diperoleh

dan

sehingga persamaan regresi parabola dapat ditulis:


(s3.amazonaws.com,20..)
2. Regresi Hiperbola, merupakan bentuk regresi dengan fungsi pecahan
atau fungsi resiprokal.
Y2 = a + b1X1 + b2X22 + ... + bnXnm
Atau Y =
Y
Xn
a
bn
Xnm

: variaber terikat
: variabel bebas ke-n
: konstanta
: kemiringan ke-n
: variabel bebas pangkat ke-m

Contoh soal:
Toko Maju Makmur pada hari pertama pembukaan memiliki
jumlah pengunjung yang berbeda pada setiap menitnya. Pada menitmenit pertama pembukaan, terdapat banyak pengunjung yang tertarik
untuk melihat-lihat dan membeli di toko tersebut. Data pengunjung
diberikan sebagai berikut:
X = menit setelah toko dibuka Y = jumlah pengunjung toko

X
20
35
60
100
150
300
500
800
1200
1300
1500
1600

Y
150
125
105
100
92
97
97
62
58
40
38
35

Nilai-nilai yang diperlukan untuk mencari parameter adalah


sebagai berikut:

jumlah

X
20
35
60
100
150
300
500
800
1200
1300
1500
1600
7565

diperoleh

sehingga didapat:

Y
150
125
105
100
92
97
97
62
58
40
38
35
-

1/y
0.006667
0.008
0.009524
0.01
0.01087
0.010309
0.010309
0.016129
0.017241
0.025
0.026316
0.028571
0.178936

x^2
400
1225
3600
10000
22500
90000
250000
640000
1440000
1690000
2250000
2560000
8957725

x.1/y
0.133333
0.28
0.571429
1
1.630435
3.092784
5.154639
12.90323
20.68966
32.5
39.47368
45.71429
163.1435

Jadi persamaan regresi model hiperbola dari data di atas adalah

(s3.amazonaws.com, 2...)
3. Regresi fungsi pangkat tiga
y = a + bx + cx2 + dx3
4. Regresi Eksponensial, merupakan bentuk regresi dimana variabel bebas
X sebagai pangkat dari koefisien (fungsi eksponen).
Y = abx
Y
: variabel terikat
X
: variabel bebas
a,b : konstanta
Contoh soal :
Seoarang peneliti ingin mengetahui pertumbuhan paru-paru itik
Bali, untuk tujuan tersebut dipelihara 20 ekor itik. Itik tersebut dipotong

masing-masing 5 ekor pada minggu ke 0, 2, 4 dan 6 dan kemudian


diambil paru-parunya lalu dilakukan penimbangan.

Umur
(Minggu)

Berat
Ulangan Paru-Paru

(X)

Jawab :

1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5

(Y)
35
25
34
49
45
115
128
101
95
130
310
310
305
305
320
980
880
1010
985
1025

(s3.amazonaws.com,2....)

jadi,

5. Regresi Geometri, merupakan bentuk regresi dimana dalam fungsi


terdapat fungsi trigonometri.
Y = a + b1sin cX1 + b1cos cX2 + ...
Y
: variaber terikat
Xn : variabel bebas ke-n
a
: konstanta
bn
: kemiringan ke-n
sin c : fungsi trigonometri
(www.fp.unud.ac.id)
Sebagai contoh model geometris kita perhatikan data sebagai berikut :
x
20
35
60
100
150
300
500
800
1200
1300
1500
1600

y
150
125
105
100
92
97
97
62
58
40
38
35

Jawab :
Pertama-tama kita perhatika nilai-nilai yang perlu untuk
menghitung a dan b pada model ini.
X
20
35

Y
150
125

log X
log Y
log X log Y log^2 X
1.301029996 2.176091259 2.831160001 1.69267905
1.544068044 2.096910013 3.237771743 2.384146126

60
100
150
300
500
800
1200
1300
1500
1600
7565

105
100
92
97
97
62
58
40
38
35
999

1.77815125
2
2.176091259
2.477121255
2.698970004
2.903089987
3.079181246
3.113943352
3.176091259
3.204119983
29.45185764

2.021189299
2
1.963787827
1.986771734
1.986771734
1.792391689
1.763427994
1.602059991
1.579783597
1.544068044
22.51325318

3.593980279
4
4.273381526
4.921474491
5.362237316
5.203474367
5.429914407
4.98872406
5.017536872
4.947379275
53.80703434

3.161821869
4
4.735373168
6.136129711
7.284439084
8.427931473
9.481357146
9.696643201
10.08755569
10.26638486
77.35446138

(www.fp.unud.ac.id, 200.)
2. Jenis-jenis korelasi
1. Korelasi Product Moment (korelasi Pearson)
Merupakan salah satu tehnik untuk mencari tingkat keeratan hubungan
antara dua variabel dengan cara mengkalikan moment-moment atau halhal penting kedua variabel tersebut.

r
: koefisien korelasi
X
: variabel bebas
Y
: variabel terikat
n
: banyak data
2. Korelasi Rank Spearman

Kedua variabelnya berskala ordinal dan bukan data interval.

: koefisien rank spearman


d

: selisih renking

: banyak data

(sumber

http://staff.uny.ac.id/sites/default/files/pendidikan/Ali

%20Muhson,%20S

.Pd.,M.Pd./08%20ANALISIS%20KORELASI

%202013.pdf)
3. Korelasi Parsial
Merupakan pengukuran

hubungan

antara

dua

variabel,

dengan

mengontrol atau menyesuaikan efek dari satu atau lebih variabel lain.

dan

: koefisien korelasi parsial X1 dengan Y, mengendalikan X2


: koefisien korelasi parsial X2 dengan Y, mengendalikan X1
: koefisien korelasi X1 dengan Y
: koefisien korelasi X2 dengan Y
: koefisien korelasi X1 dengan X2
(staff.uny.ac.id, 2012)
C. Teknik Regresi
Metode analisis regresi linear dengan variabel moderating antara lain:
1. Multiple Regression Analysis (MRA)
Metode ini dilakukan dengan menambahkan variabel perkalian
antara variabel bebas dengan variabel moderatingnya, sehingga persamaan
umumnya adalah sebagai berikut: Y = a + b1 X1 + b2 X2 + b3 X1 X2

dengan Y adalah kinerja, X1 adalah kepuasan kerja, X2 kompensasi dan X1


X2 adalah perkalian antara kepuasan kerja dengan kompensasi. Hipotesis
moderating diterima jika variabel X1 X2 mempunyai pengaruh signifikan
terhadap Y, tidak tergantung apakah X1 dan X2 mempunyai pengaruh
terhadap

atau

tidak.

Model

ini

biasanya

menyalahi

asumsi

multikolinearitas atau adanya korelasi yang tinggi antara variabel bebas


dalam model regresi, sehingga menyalahi asumsi klasik. Hampir tidak ada
model MRA yang terbebas dari masalah multikolinearitas, sehingga
sebenarnya model ini tidak disarankan untuk dipergunakan.
2. Absolut residual
Model ini mirip dengan MRA, tetapi variabel moderating didekati
dengan selisih mutlak (absolut residual) antara variabel bebas dengan
variabel moderatingnya. Penerimaan hipotesis juga sama, dan model ini
masih riskan terhadap gangguan multikolinearitas meskipun risiko itu lebih
kecil dari pada dengan metode MRA.
3. Residual
Model ini menggunakan konsep lack of fit yaitu hipotesis
moderating diterima terjadi jika terdapat ketidakcocokan dari deviasi
hubungan linear antara variabel independen. Langkahnya adalah dengan
meregresikan antara kepuasan kerja terhadap kompensasi dan dihitung nilai
residualnya. Pada program SPSS dengan klik Save pada regreesion, lalu klik
pada usntandardized residual. Nilai residual kemudian diambil nilai
absolutnya lalu diregresikan antara kinerja terhadap absolut residual.
( rudisiswoyo89.blogspot.co.id,2013)
4. Uji Heteroskedastisitas
Uji heteroskedastisitas adalah untuk melihat apakah terdapat
ketidaksamaan varians dari residual satu ke pengamatan ke pengamatan
yang lain. Model regresi yang memenuhi persyaratan adalah di mana
terdapat kesamaan varians dari residual satu pengamatan ke pengamatan
yang lain tetap atau disebut homoskedastisitas.
5. Uji Autokorelasi

Uji autokorelasi adalah untuk melihat apakah terjadi korelasi antara


suatu periode t dengan periode sebelumnya (t -1). Secara sederhana adalah
bahwa analisis regresi adalah untuk melihat pengaruh antara variabel bebas
terhadap variabel terikat, jadi tidak boleh ada korelasi antara observasi
dengan data observasi sebelumnya. Uji autokorelasi hanya dilakukan pada
data time series (runtut waktu) dan tidak perlu dilakukan pada data cross
section seperti pada kuesioner di mana pengukuran semua variabel
dilakukan secara serempak pada saat yang bersamaan. Model regresi pada
penelitian di Bursa Efek Indonesia di mana periodenya lebih dari satu tahun
biasanya memerlukan uji autokorelasi

6. Uji Multikolinearitas
Uji multikolinearitas adalah untuk melihat ada atau tidaknya korelasi
yang tinggi antara variabel-variabel bebas dalam suatu model regresi linear
berganda. Jika ada korelasi yang tinggi di antara variabel-variabel bebasnya,
maka hubungan antara variabel bebas terhadap variabel terikatnya menjadi
terganggu.

Beberapa

alternatif

cara

untuk

mengatasi

masalah

multikolinearitas adalah sebagai berikut:


a) Mengganti atau mengeluarkan variabel yang mempunyai korelasi yang
tinggi.
b) Menambah jumlah observasi.
c) Mentransformasikan data ke dalam bentuk lain, misalnya logaritma
natural, akar kuadrat atau bentuk first difference delta.
(www.konsultanstatistik.com,2009)
7. Persamaan Berbasis Regresi
Model kausal mengasumsikan bahwa variabel yang

diramalkan

(variabel dependent) terkait dengan variabel lain (variabel independent)


dalam tabel. pendekatan ini mencoba untuk melakukan proyeksi
berdasarkan hubungan tersebut. dalam bentuknya yang paling sederhana,
regresi linier digunakan untuk mencocokkan baris ke data. baris itu

kemudian digunakan untuk meramalkan variabel dependent yang dipilih


untuk beberapa nilai dari variabel independent. model yang digunakan sama
dengan model pada regresi linier berganda, yaitu:

dimana:
y = nilai observasi dari variabel yang diukur
b0 = konstanta
X = variabel pengukur (independent)
= variabel sugrogales (dummy)
= error
8. Regresi Stepwise
Model regresi terbaik terkadang didapatkan dari beberapa tahapan
pemikiran. daftar sejumlah variabel penjelas tersedia dan dari data itu dicari
variabel mana yang seharusnya dimasukkan ke dalam model. variabel
penjelas terbaik akan digunakan pertama kali, dan kemudian yang kedua,
dan seterusnya. prosedur ini dikenal dengan regresi stepwise.
model dalam regresi stepwise adalah:
sedangkan hipotesis yang digunakan dalam regresi stepwise adalah:
dengan hipotesisnya alternatif adalah:
(www.duwiconsultant.com,2011)
D. Pengertian Regresi Dummy dan Logistik
1. Regresi Dummy
Nama lain dari regresi dummy adalah regresi kategori. Regresi ini
menggunakan predictor kualitatif (yang bukan dummy dinamai predictor
kuantitatif). Pembahasan pada regresi ini mempunyai hanya untuk satu
macam variabel dummy dan dikhususkan pada penafsiran parameter dan
kemaknaan pengaruh predictor.

Secara implisit, teknik penggunaan variabel dummy pada dasarnya


mengandung asumsi bahwa variabel kuantitatif mempengaruhi intersep
tetapi tidak mempengaruhi koefisien kemiringan dan berbagai regresi sub
kelompok.
(sumber:http://jurnaldichaniago.wordpress.com/2008/09/22/regresi.atas.va
riabel.dummy)
Tujuan menggunakan regresi berganda dummy adalah memprediksi
besarnya nilai variabel tergantung/dependent atas dasar satu atau lebih
variabel bebas/independent, di mana satu atau lebih variabel bebas yang
digunakan bersifat dummy. Variabel dummy adalah variabel yang
digunakan untuk membuat kategori data yang bersifat kualitatif (data
kualitatif tidak memiliki satuan ukur), agar data kualitatif dapat digunakan
dalam analisa regresi maka harus lebih dahulu di transformasikan ke
dalam bentuk Kuantitatif. contoh data kualitatif misal jenis kelamin adalah
laki-laki dan perempuan, harus di transform ke dalam bentuk Laki-laki = 1
; Perempuan = 0. atau tingkat pendidikan misal SMA dan Sarjana, maka
diubah menjadi SMA = 0 ; Sarjana = 1, skala yang terdiri dari dua yakni 0
dan 1 disebut kode Binary, sedangkan persamaan model yang terdiri dari
Variabel Dependentnya Kuantitatif dan variabel Independentnya skala
campuran : kualitatif dan kuantitatif, maka persamaan tersebut disebut
persamaan regresi berganda Dummy. Dalam kegiatan penelitian, kadang
variabel yang akan diukur bersifat Kualitatif, sehingga muncul kendala
dalam pengukuran, dengan adanya variabel dummy tersebut, maka besaran
atau nilai variabel yang bersifat kualitatif tersebut dapat di ukur dan diubah
menjadi kuantitatif.
Berikut akan dijelaskan mengenai bagaimana cara menggunakan
persamaan estimasi yang telah di peroleh melalui analisa regresi berganda
Dummy, ingat ada tiga variabel yang digunakan dalam persamaan model
yakni : variabel Gaji merupakan variabel kuantitatif, variabel Gender
terdiri dari 0 : perempuan dan 1 : pria ; variabel Pendidikan terdiri dari 0 :
SMA dan 1 : Sarjana (variabel Gender dan Didik adalah variabel

kualitatif) dan variabel yang terakhir adalah variabel Usia merupakan


variabel kuantitatif.
(Sumber

http://putuartayasa.blogspot.com/2011/05/estimasi-melalui-

persamaan-dalam.html)
Contoh kasus:
Seorang peneliti tertarik untuk memprediksi laba 2 macam perusahaan
(swasta asing dan swasta nasional) bila ditinjau dari besarnya biaya iklan
yang dikeluarkan oleh perusahaan untuk membuat iklan mengenai
produknya. (Untuk perusahaan swasta asing, laba yang diamati adalah laba
yang diperoleh dari hasil penjualan produknya di wilayah Indonesia saja.)
Kasus

semacam

ini

dapat

diselesaikan

dengan

metode

regresi

menggunakan variabel dummy. Hanya saja yang perlu diperhatikan adalah


teknik menyusun variabel dummy dalam analisis regresinya.
Dari contoh kasus di atas, variabel respon (Y) adalah Laba perusahaan,
variabel bebas (X) adalah biaya iklan, sedangkan variabel dummy-nya
adalah tipe perusahaan, yaitu swasta asing dan swasta nasonal. Kita sebut
terdapat 2 tipe/kategori perusahaan.
Untuk menyusun variabel dummy-nya, maka kita perlu menentukan
terlebih dahulu banyaknya variabel dummy yang digunakan. Banyaknya
variabel dummy yang digunakan adalah sebanyak kategori dikurangi satu.
Rumus: banyaknya var dummy = banyaknya kategori 1. Dalam kasus
kita di atas, maka banyaknya variabel dummy adalah = 2 - 1 = 1 buah.
Misalkan jika perusahaan swasta asing dilambangkan dengan angka 1,
sedangkan swasta nasional 0.
(ineddeni.wordpress.com,2007)
Terdapat tiga model regresi dummy sebagai berikut:
a. Y = a + bX + c D1 (Model

Dummy

Intersep)diasumsikan

bahwa

intersep tidak berlaku umum untuk seluruhindividu di dalam sampel.

b. Y = a + bX + c (D1X) (Model Dummy Slope) Jika pengelompokan


atau pengamatan kualitatif juga mempengaruhihubungan antara Y dan
X.
c. Y = a + bX + c (D1X) + d D1 (Kombinasi)Ketika diasumsikan bahwa
pengelompokan atau pengamatankualitatif mempengaruhi slope
maupun intersep dari model.
(www.academia.edu,2011)

2. Regresi logistik
Regresi logistik (logistic regression) sebenarnya sama dengan analisis
regresi berganda, hanya variabel terikatnya merupakan variabel dummy (0
dan 1). Sebagai contoh, pengaruh beberapa rasio keuangan terhadap
keterlambatan penyampaian laporan keuangan. Maka variabel terikatnya
adalah 0 jika terlambat dan 1 jika tidak terlambat (tepat). Regresi logistik
tidak memerlukan asumsi normalitas, meskipun screening data outliers
tetap dapat dilakukan. Untuk asumsi multikolinearitas pada regresi logistik
silahkan simak di sini.
Interpretasi regresi logistik menggunakan odd ratio atau kemungkinan.
Sebagai contoh, jika rasio keuangan ROA meningkat sebesar 1% maka
kemungkinan ketepatan menyampaikan laporan keuangan meningkat
sebesar 1,05 kali. Berarti semakin tinggi ROA kemungkinan tepat semakin
tinggi. Atau jika rasio keuangan DER meningkat sebesar 2% maka
kemungkinan ketepatan penyampaian laporan keuangan meningkat sebesar
0,98 kali atau bisa dikatakan menurun karena lebih kecil dari 1 yang
berarti kemungkinan terlambat semakin tinggi.
(konsultanstatistik.com,2009)

Regresi logistik (kadang disebut model logistik atau model logit),


dalam statistika digunakan

untuk

prediksiprobabilitas kejadian

suatu

peristiwa dengan mencocokkan data pada fungsi logit kurva logistik.


Metode ini merupakan model linier umum yang digunakan untuk regresi
binomial. Seperti analisis regresi pada umumnya, metode ini menggunakan
beberapa variabel prediktor, baik numerik maupun kategori. Misalnya,
probabilitas bahwa orang yang menderita serangan jantung pada waktu
tertentu dapat diprediksi dari informasi usia, jenis kelamin, dan indeks
massa tubuh. Regresi logistik juga digunakan secara luas pada bidang
kedokteran

dan

ilmu

sosial,

maupun

pemasaran

seperti

prediksi

kecenderungan pelanggan untuk membeli suatu produk atau berhenti


berlangganan.

Fungsi logistik, dengan z pada sumbu hosrizontal dan(z)


pada sumbu vertikal
Contoh Kasus :
Seorang peneliti ingin mengetahui bagaimana pengaruh kualitas
pelayanan public terhadap kepuasan pengguna (masyarakat). Kualitas
pelayanan publik diteliti melaluji variabel Daya Tanggap (X1) dan Empati
(X2). Kepuasan penggunana layanan (Y) sebagai variabel dependent adalah
variabel dummy dimana dimana jika responden menjawab puas maka kita
beri skor 1 dan jika menjawab tidak puas kita beri skor 0.
Y=

Y : variabel terikat
X : variabel bebas
a,b: konstanta
(statistik4file.blogspot.com,2009)
E. Definisi dan Bentuk Diagram Pencar
1. Diagram Pencar (SCATTER PLOT)
Diagram Scatter atau diagram pencar atau juga disebut diagram sebar adalah
gambaran yang menunjukkan kemungkinan hubungan (korelasi) antara
pasangan dua macam variabel dan menunjukkan keeratan hubungan antara
dua variabel tersebut yang sering diwujudkan sebagai koefisien korelasi.
Scatter diagram juga dapat digunakan untuk mengecek apakah suatu
variabel dapat digunakan untuk mengganti variabel yang lain.
2. Manfaat Diagram Scatter
Dikatakan juga bahwa Scatter diagram menunjukan hubungan antara
dua variabel. Scatter diagram sering digunakan sebagai analisis tindak lanjut
untuk menentukan apakah penyebab yang ada benar-benar memberikan
dampak kepada karakteristik kualitas. Pada contoh terlihat scatter diagram
yang menggambarkan plot pengeluaran untuk iklan dengan penjualan
perusahaan yang mengindikasikan hubungan kuat positif diantara dua
variabel. Jika pengeluaran untuk iklan meningkat, penjualan cenderung
meningkat.
Pada umumnya, bila kita berbicara tentang hubungan antara dua
macam data, kita sesungguhnya membicarakan tentang : a). Hubungan
penyebab dan akibatnya. b). Hubungan antara satu penyebab dengan
penyebab lainnya. c). Hubungan antara satu penyebab dengan dua
penyebab. Secara grafis, jika kita menggambarkan "akibat pada sumbu
vertikal dan "penyebab" pada sumbu horisontal, maka kita akan
mendapatkan sebuah peta yang disebut dengan scatter diagram.
3. Cara Penyajian Data
Untuk kumpulan data yang terdiri atas dua variabel dengan nilai
kumulatif, diagramnya dapat dibuat dalam sistem sumbu kordinat dan
gambarnya akan merupakan kumpulan titik-titik yang terpancar. Tahapan-

tahapan ini menerangkan setelah penelitian menyelesaikan analisi datanya


dengan cermat, kemudian langkah selanjutnya peneliti menginterpretasikan
hasil analisinya. Akhirnya peneliti menarik suatu kesimpulan yang berisikan
intisari dan seluruh rangkaian kegiatan peneliatian dan membuat
rekomendasinya. Menginterpretasikan hasil analisi perlu diperhatikan halhal antara lain : interpretasi tidak melenceg dari analisis, interpretasi harus
masih dalam batas kerangka penelitian, dan secara etis penelitian rela
mengemukakakn kesulitan dan dari hambatan-hambatan sewaktu dalam
penelitian. (file.upi.edu,2013)

4. Langkah-Langkah Membuat Diagram Pencar


a. Kumpulkan pasangan data (x,y), yaitu hal-hal yang ingin dipelajari
keterkaitannya dan

atur data dalam sebuah tabel dengan data paling

sedikit 30 pasangan data.


b. Carilah nilai maksimum dan minimum untuk kedua x dari y. Tetapkan
skala pada sumbu horisontal dan vertikal sehingga panjang keduanya
mendekati sama, sehingga diagram akan lebih mudah terbaca.
c. Gambar data pada kertas. Bila didapatkan nilai data yang sama dari
pengamatan yang berbeda, tunjukkan titik ini dengan menggamba
lingkaran sepusat atau gambar titik ke dua dalam daerah terdekat dari
yang pertama.
d. Masukkan semua item yang diperlukan. Pastikan item berikut termasuk
sehingga setiap orang di luar yang membuat diagram dapat mengerti
secara sepintas mengenai selang waktu, jumlah pasangan data, judul
unit setiap sumbu dan judul grafik.
(lecturer.eepisits.edu,2014)
5. Jenis-Jenis Diagram Pencar
a. Diagram Pencar Linear Positif

Diagram pencar ini memiliki hubungan yang saling sejalan/searah dan


membentuk garis lurus dari persamaan yang didapatkan. Dimana apabila nilai
X naik maka nilai Y juga ikut naik.
b. Diagram Pencar Linear Negatif
Digaram pencar ini memiliki hubungan yang berhubungan dengan kedua
variabelnya. Dimana apabila nilai X meningkat maka
nilai Y nya menurun. Dan persamaannya membentuk
garis lurus. Oleh karena itu dikatakan diagram pencar
linear negatif.
c. Diagram Pencar Curve Linear Positif
Diagram ini hampir sama dengan linear positif hanya saja garis yang
dihasilkan membentuk kurva karena persamaannya kuadrat.

d. Diagram Pencar Curve Linear Negatif


Diagram ini hampir sama dengan linear negatif hanya saja garis yang
dihasilkan membentuk kurva karena persamaannya kuadrat.

e.

Diagram Pencar Curve Linear


Diagram pencar ini

menggambarkan

kondisi dimana didapatkan hubungan antara variabel X dan Y yang


meningkat

namus

saat

mencapai

keadaan

maksimum

keduanya

mengalami penurunan. Jadi garis yang dihasilkan membentuk kurva


persamaan kuadrat juga.

f. Diagram Pencar Tak Tentu


Diagram pencar ini menggambarkan seolah-olah tidak ada hubungan
antara variabelX dan Y seolah-olah keduanya tidak saling mempengaruhi
karena diagram yang didapatkan tersebar secara acak dan tidak berpola.
(www.kuliah.ftsl.itb.ac.id,2009)
Standard Error of Estimate

F.

Ketepatan garis regresi dapat dilihat apabila


semua sebaran titik mendekati garis regresi. Penyebaran dan penyimpangan
titik-titik tersebut dari garis regresi disebut dengan standard error of estimate.
Se

Y Y '
N 2

atau
Se

Y 2 aY bXY
N 2

Perhitungan Se untuk kasus iklan dan penjualan adalah sebagai berikut :

Se

5,23
1,3075 1,14
4

penyimpangan standar ini sama dengan deviasi standar, yaitu penyimpangan


baku terhadap nilai rata-ratanya.

(www.elearning.amikom.ac.id,2008)

G. Uji Multikolinieritas dan Autokorelasi


1. Multikolinearitas
Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi
yang tinggi antara masing-masing variabel independen dalam model regresi.
Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang
digunakan saling terkait dalam suatu model regresi. Oleh karena itu masalah
multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya
melibatkan satu variabel independen.
Indikasi terdapat masalah multikolinearitas dapat kita lihat dari kasus-kasus
sebagai berikut:
1. Nilai R2 yang tinggi (signifikan), namun nilai standar error dan tingkat
signifikansi masing-masing variabel sangat rendah.
2. Perubahan kecil sekalipun pada data akan menyebabkan perubahan
signifikan pada variabel yang diamati.
3. Nilai koefisien variabel tidak sesuai dengan hipotesis, misalnya variabel
yang seharusnya memiliki pengaruh positif (nilai koefisien positif),
ditunjukkan dengan nilai negatif.
Memang belum ada kriteria yang jelas dalam mendeteksi masalah
multikolinearitas dalam model regresi linier. Selain itu hubungan korelasi
yang tinggi belum tentu berimplikasi terhadap masalah multikolinearitas.
Tetapi kita dapat melihat indikasi multikolinearitas dengan tolerance value
(TOL), eigenvalue, dan yang paling umum digunakan adalah varians
inflation factor (VIF).
Hingga saat ini tidak ada kriteria formal untuk menentukan batas terendah
dari nilai toleransi atau VIF. Beberapa ahli berpendapat bahwa nilai toleransi
kurang dari 1 atau VIF lebih besar dari 10 menunjukkan multikolinearitas
signifikan, sementara itu para ahli lainnya menegaskan bahwa besarnya R 2
model dianggap mengindikasikan adanya multikolinearitas. Klein (1962)

menunjukkan bahwa, jika VIF lebih besar dari 1/(1 R2) atau nilai toleransi
kurang dari (1 R2), maka multikolinearitas dapat dianggap signifikan
secara statistik.
B. Autokorelasi
Uji autokorelasi digunakan untuk melihat apakah ada hubungan linier
antara error serangkaian observasi yang diurutkan menurut waktu (data
time series). Uji autokorelasi perlu dilakukan apabila data yang dianalisis
merupakan data time series (Gujarati, 1993).

dimana:
d = nilai Durbin Watson ei = jumlah kuadrat sisa
Nilai Durbin Watson kemudian dibandingkan dengan nilai d-tabel. Hasil
perbandingan akan menghasilkan kesimpulan seperti kriteria sebagai
berikut:
1. Jika d < dl, berarti terdapat autokorelasi positif
2. Jika d > (4 dl), berarti terdapat autokorelasi negatif
3. Jika du < d < (4 dl), berarti tidak terdapat autokorelasi
4. Jika dl < d < du atau (4 du), berarti tidak dapat disimpulkan
Berikut ini adalah daerah pengujian durbin watson:

Seandainya kita memiliki variabel dependen (Y) tingkat inflasi di Amerika


Serikat, dengan variabel independen yang diamati adalah kurs Yen terhadap
US$ (X1), kurs Rupiah terhadap US$ (X2), dan kurs US$ terhadap
Poundsterling (X3), maka kita akan memilki model sebagai berikut:
Y = 0 + 1X1 + 2X2 + 3X3 +
(onlinestatbook.com,2014)