yang
diwujudkan
dalam
suatu
model
matematis.
(www.pengertianahli.com,2014)
Analisis regresi dalam statistika adalah salah satu metode untuk menentukan
hubungan sebab-akibat antara satu variabel dengan variabel(-variabel) yang
lain. Variabel "penyebab" disebut dengan bermacam-macam istilah:
variabel penjelas, variabel eksplanatorik, variabel independen, atau secara
bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai
absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang
dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua
variabel ini dapat merupakan variabel acak (random), namun variabel yang
dipengaruhi harus selalu variabel acak.
Analisis regresi adalah salah satu analisis yang paling populer dan luas
pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan
prediksi dan ramalan, dengan penggunaan yang saling melengkapi dengan
bidang pembelajaran mesin. Analisis ini juga digunakan untuk memahami
variabel bebas mana saja yang berhubungan dengan variabel terikat, dan
untuk mengetahui bentuk-bentuk hubungan tersebut. (www.usu.ac.id.2013)
2. Pengertian Korelasi
Analisis korelasi adalah alat statistik yag dapat digunakan untuk mengetahui
derajat hubungan linear antara satu variabel dengan variabel yang lain
(algifri,2000:45).
Umumnya
analisis
korelasi
digunakan,
dalam
Antara variabel bebas (X) dan variabel terikat (Y) membentuk sebuah
pola garis yang lurus, dan dalam aplikasinya jika nilai X meningkat maka
nilai Y juga meningkat dan jika nilai X mengalami penurunan makan
nilai Y juga mengalami penurunan.
Didalam teorinya analisa regresi linear mempunyai dua bentuk
persamaan yaitu:
1. Analisa regresi linear sederhana
Yang dimaksud dengan hubungan linear sederhana adalah yang
ditunjukkan dengan persamaan Y= a+ bX. Persamaan ini hanya
memiliki 2 variabel saja, hanya satu variabel terikat(Y) dan satu
variabel bebas (X) . Sehingga setiap nilai X bertambah dengan satu
satuan maka nilai Y akan bertambah dengan b. kalau nilai X=0 maka
nilai Y sebesar a saja.
Penggunaan model regresi sederhana hanya memungkinkan bila
pengaruh yang ada itu hanya dari independent variabel (variabel
bebas) terhadap dependent variabel (variabel terikat), tidak boleh ada
pengaruh timbal balik, yaitu jika variabel terikat juga berpengaruh
terhadap variabel bebas.
Dalam regresi linear sederhana dihindari sifat autokorelasi . yang
dimaksud dengan autokorelasi adalah hubungan antara nilai suatu
variabel dengan nilai variabel yang lain sama( Pangestu, 2004: 155).
Misalnya kalau pada tahun pembelian bak penampunagn air banyak
sekali, maka pembelian bak mandi 10 tahun lagi juga akan banyak,
karena usia bak air tersebut memang hanya bertahan 10 tahun. Yang
dibeli 10 tahun sebelumnya akan rusak, sehingga pemebelian secara
bersama-sama setiap 10 tahun sekali, sehingga pembelian akan
melonjak. Dengan kata lain ada hubunagn antara pembelian bak air
yang sama dengan pemeblian 10 tahun yang akan datang. Inilah yang
dimaksud adanya autokorelasi.
Ciri penting dari regresi sederhana adalah apabila terdapat
homoscedasticity. Homoscedasticity adalah kesamaan distribusi Y
1992
1993
1994
1995
1996
Biaya Promosi
Volume Penjualan
(Juta Rupiah)
2
4
5
7
8
x = 26
10
24
40
70
88
xy =
4
16
25
49
64
x = 158
25
36
64
100
121
y =
232
346
bentuk umum persaman regresi linier sederhana : Y = a + b X
n=5
yi
i 1
x
i 1
n
n n
n xi y i n xi n y i
i 1 i 1
b i 1
2
n
n
2
n xi n xi y
i 1
i 1
produk
mobil,
mungkin
faktor-faktor
yang
dimana:
y = penjualan produk mobil
X4 =pengaruh liingkungan
X1 = citra merk
X5 = iklan media
b = koefisien regresi
X3 = harga kompetitif
e = error
(skripsimahasiswa.blogspot.com,2010)
b. Regresi Non-linier
Regresi non-linier terbagi atas beberapa, antara lain:
1. Regresi Polinomial, merupakan bentuk regersi dengan variabel bebas
X yang memiliki fungsi berpangkat yang berurut.
Y = a + b1X1 + b2X22 + ... + bnXnm
Y
: variaber terikat
Xn : variabel bebas ke-n
a : konstanta
bn : kemiringan ke-n
Xnm : variabel bebas pangkat ke-m
Contoh:
Seorang peneliti ingin mengetahui hubungan antara dosis oba
tertentu (X) dengan kadar Creatinin Ginjal (Y) kelinci percobaan,
dari hasil peneitiannya diperoleh hasil sebagai berikut :
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Dosis Obat
1
2
3
4
5
7
3
2
4
6
7
8
8
1
3
Kadar Creatin
10
13
15
20
16
11
14
12
21
17
10
7
6
11
16
Jawab:
Kita tentukan dulu nilai yang perlu untuk regresi polinom
berderajat dua, yaitu:
No.
1
2
3
4
5
6
7
8
9
Dosis
Kadar
Obat (X)
1
2
3
4
5
7
3
2
4
Creatin (Y)
10
13
15
20
16
11
14
12
21
X^2
X^3
X^4
XY
X^2Y
1
4
9
16
25
49
9
4
16
1
8
27
64
125
343
27
8
64
1
16
81
256
625
2401
81
16
256
10
26
45
80
80
77
42
24
84
10
52
135
320
400
539
126
48
336
10
11
12
13
14
15
Jumlah
6
17
36
216
1296
102
7
10
49
343
2401
70
8
7
64
512
4096
56
8
6
64
512
4096
48
1
11
1
1
1
11
3
16
9
27
81
48
64
199
356
2278
15704
803
dari table diatas kita memperoleh persamaan normal:
Setelah
persamaan
simultan
ini
diselesaikan,
,
612
490
448
384
11
144
4055
diperoleh
dan
: variaber terikat
: variabel bebas ke-n
: konstanta
: kemiringan ke-n
: variabel bebas pangkat ke-m
Contoh soal:
Toko Maju Makmur pada hari pertama pembukaan memiliki
jumlah pengunjung yang berbeda pada setiap menitnya. Pada menitmenit pertama pembukaan, terdapat banyak pengunjung yang tertarik
untuk melihat-lihat dan membeli di toko tersebut. Data pengunjung
diberikan sebagai berikut:
X = menit setelah toko dibuka Y = jumlah pengunjung toko
X
20
35
60
100
150
300
500
800
1200
1300
1500
1600
Y
150
125
105
100
92
97
97
62
58
40
38
35
jumlah
X
20
35
60
100
150
300
500
800
1200
1300
1500
1600
7565
diperoleh
sehingga didapat:
Y
150
125
105
100
92
97
97
62
58
40
38
35
-
1/y
0.006667
0.008
0.009524
0.01
0.01087
0.010309
0.010309
0.016129
0.017241
0.025
0.026316
0.028571
0.178936
x^2
400
1225
3600
10000
22500
90000
250000
640000
1440000
1690000
2250000
2560000
8957725
x.1/y
0.133333
0.28
0.571429
1
1.630435
3.092784
5.154639
12.90323
20.68966
32.5
39.47368
45.71429
163.1435
(s3.amazonaws.com, 2...)
3. Regresi fungsi pangkat tiga
y = a + bx + cx2 + dx3
4. Regresi Eksponensial, merupakan bentuk regresi dimana variabel bebas
X sebagai pangkat dari koefisien (fungsi eksponen).
Y = abx
Y
: variabel terikat
X
: variabel bebas
a,b : konstanta
Contoh soal :
Seoarang peneliti ingin mengetahui pertumbuhan paru-paru itik
Bali, untuk tujuan tersebut dipelihara 20 ekor itik. Itik tersebut dipotong
Umur
(Minggu)
Berat
Ulangan Paru-Paru
(X)
Jawab :
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
(Y)
35
25
34
49
45
115
128
101
95
130
310
310
305
305
320
980
880
1010
985
1025
(s3.amazonaws.com,2....)
jadi,
y
150
125
105
100
92
97
97
62
58
40
38
35
Jawab :
Pertama-tama kita perhatika nilai-nilai yang perlu untuk
menghitung a dan b pada model ini.
X
20
35
Y
150
125
log X
log Y
log X log Y log^2 X
1.301029996 2.176091259 2.831160001 1.69267905
1.544068044 2.096910013 3.237771743 2.384146126
60
100
150
300
500
800
1200
1300
1500
1600
7565
105
100
92
97
97
62
58
40
38
35
999
1.77815125
2
2.176091259
2.477121255
2.698970004
2.903089987
3.079181246
3.113943352
3.176091259
3.204119983
29.45185764
2.021189299
2
1.963787827
1.986771734
1.986771734
1.792391689
1.763427994
1.602059991
1.579783597
1.544068044
22.51325318
3.593980279
4
4.273381526
4.921474491
5.362237316
5.203474367
5.429914407
4.98872406
5.017536872
4.947379275
53.80703434
3.161821869
4
4.735373168
6.136129711
7.284439084
8.427931473
9.481357146
9.696643201
10.08755569
10.26638486
77.35446138
(www.fp.unud.ac.id, 200.)
2. Jenis-jenis korelasi
1. Korelasi Product Moment (korelasi Pearson)
Merupakan salah satu tehnik untuk mencari tingkat keeratan hubungan
antara dua variabel dengan cara mengkalikan moment-moment atau halhal penting kedua variabel tersebut.
r
: koefisien korelasi
X
: variabel bebas
Y
: variabel terikat
n
: banyak data
2. Korelasi Rank Spearman
: selisih renking
: banyak data
(sumber
http://staff.uny.ac.id/sites/default/files/pendidikan/Ali
%20Muhson,%20S
.Pd.,M.Pd./08%20ANALISIS%20KORELASI
%202013.pdf)
3. Korelasi Parsial
Merupakan pengukuran
hubungan
antara
dua
variabel,
dengan
mengontrol atau menyesuaikan efek dari satu atau lebih variabel lain.
dan
atau
tidak.
Model
ini
biasanya
menyalahi
asumsi
6. Uji Multikolinearitas
Uji multikolinearitas adalah untuk melihat ada atau tidaknya korelasi
yang tinggi antara variabel-variabel bebas dalam suatu model regresi linear
berganda. Jika ada korelasi yang tinggi di antara variabel-variabel bebasnya,
maka hubungan antara variabel bebas terhadap variabel terikatnya menjadi
terganggu.
Beberapa
alternatif
cara
untuk
mengatasi
masalah
diramalkan
dimana:
y = nilai observasi dari variabel yang diukur
b0 = konstanta
X = variabel pengukur (independent)
= variabel sugrogales (dummy)
= error
8. Regresi Stepwise
Model regresi terbaik terkadang didapatkan dari beberapa tahapan
pemikiran. daftar sejumlah variabel penjelas tersedia dan dari data itu dicari
variabel mana yang seharusnya dimasukkan ke dalam model. variabel
penjelas terbaik akan digunakan pertama kali, dan kemudian yang kedua,
dan seterusnya. prosedur ini dikenal dengan regresi stepwise.
model dalam regresi stepwise adalah:
sedangkan hipotesis yang digunakan dalam regresi stepwise adalah:
dengan hipotesisnya alternatif adalah:
(www.duwiconsultant.com,2011)
D. Pengertian Regresi Dummy dan Logistik
1. Regresi Dummy
Nama lain dari regresi dummy adalah regresi kategori. Regresi ini
menggunakan predictor kualitatif (yang bukan dummy dinamai predictor
kuantitatif). Pembahasan pada regresi ini mempunyai hanya untuk satu
macam variabel dummy dan dikhususkan pada penafsiran parameter dan
kemaknaan pengaruh predictor.
http://putuartayasa.blogspot.com/2011/05/estimasi-melalui-
persamaan-dalam.html)
Contoh kasus:
Seorang peneliti tertarik untuk memprediksi laba 2 macam perusahaan
(swasta asing dan swasta nasional) bila ditinjau dari besarnya biaya iklan
yang dikeluarkan oleh perusahaan untuk membuat iklan mengenai
produknya. (Untuk perusahaan swasta asing, laba yang diamati adalah laba
yang diperoleh dari hasil penjualan produknya di wilayah Indonesia saja.)
Kasus
semacam
ini
dapat
diselesaikan
dengan
metode
regresi
Dummy
Intersep)diasumsikan
bahwa
2. Regresi logistik
Regresi logistik (logistic regression) sebenarnya sama dengan analisis
regresi berganda, hanya variabel terikatnya merupakan variabel dummy (0
dan 1). Sebagai contoh, pengaruh beberapa rasio keuangan terhadap
keterlambatan penyampaian laporan keuangan. Maka variabel terikatnya
adalah 0 jika terlambat dan 1 jika tidak terlambat (tepat). Regresi logistik
tidak memerlukan asumsi normalitas, meskipun screening data outliers
tetap dapat dilakukan. Untuk asumsi multikolinearitas pada regresi logistik
silahkan simak di sini.
Interpretasi regresi logistik menggunakan odd ratio atau kemungkinan.
Sebagai contoh, jika rasio keuangan ROA meningkat sebesar 1% maka
kemungkinan ketepatan menyampaikan laporan keuangan meningkat
sebesar 1,05 kali. Berarti semakin tinggi ROA kemungkinan tepat semakin
tinggi. Atau jika rasio keuangan DER meningkat sebesar 2% maka
kemungkinan ketepatan penyampaian laporan keuangan meningkat sebesar
0,98 kali atau bisa dikatakan menurun karena lebih kecil dari 1 yang
berarti kemungkinan terlambat semakin tinggi.
(konsultanstatistik.com,2009)
untuk
prediksiprobabilitas kejadian
suatu
dan
ilmu
sosial,
maupun
pemasaran
seperti
prediksi
Y : variabel terikat
X : variabel bebas
a,b: konstanta
(statistik4file.blogspot.com,2009)
E. Definisi dan Bentuk Diagram Pencar
1. Diagram Pencar (SCATTER PLOT)
Diagram Scatter atau diagram pencar atau juga disebut diagram sebar adalah
gambaran yang menunjukkan kemungkinan hubungan (korelasi) antara
pasangan dua macam variabel dan menunjukkan keeratan hubungan antara
dua variabel tersebut yang sering diwujudkan sebagai koefisien korelasi.
Scatter diagram juga dapat digunakan untuk mengecek apakah suatu
variabel dapat digunakan untuk mengganti variabel yang lain.
2. Manfaat Diagram Scatter
Dikatakan juga bahwa Scatter diagram menunjukan hubungan antara
dua variabel. Scatter diagram sering digunakan sebagai analisis tindak lanjut
untuk menentukan apakah penyebab yang ada benar-benar memberikan
dampak kepada karakteristik kualitas. Pada contoh terlihat scatter diagram
yang menggambarkan plot pengeluaran untuk iklan dengan penjualan
perusahaan yang mengindikasikan hubungan kuat positif diantara dua
variabel. Jika pengeluaran untuk iklan meningkat, penjualan cenderung
meningkat.
Pada umumnya, bila kita berbicara tentang hubungan antara dua
macam data, kita sesungguhnya membicarakan tentang : a). Hubungan
penyebab dan akibatnya. b). Hubungan antara satu penyebab dengan
penyebab lainnya. c). Hubungan antara satu penyebab dengan dua
penyebab. Secara grafis, jika kita menggambarkan "akibat pada sumbu
vertikal dan "penyebab" pada sumbu horisontal, maka kita akan
mendapatkan sebuah peta yang disebut dengan scatter diagram.
3. Cara Penyajian Data
Untuk kumpulan data yang terdiri atas dua variabel dengan nilai
kumulatif, diagramnya dapat dibuat dalam sistem sumbu kordinat dan
gambarnya akan merupakan kumpulan titik-titik yang terpancar. Tahapan-
e.
menggambarkan
namus
saat
mencapai
keadaan
maksimum
keduanya
F.
Y Y '
N 2
atau
Se
Y 2 aY bXY
N 2
Se
5,23
1,3075 1,14
4
(www.elearning.amikom.ac.id,2008)
menunjukkan bahwa, jika VIF lebih besar dari 1/(1 R2) atau nilai toleransi
kurang dari (1 R2), maka multikolinearitas dapat dianggap signifikan
secara statistik.
B. Autokorelasi
Uji autokorelasi digunakan untuk melihat apakah ada hubungan linier
antara error serangkaian observasi yang diurutkan menurut waktu (data
time series). Uji autokorelasi perlu dilakukan apabila data yang dianalisis
merupakan data time series (Gujarati, 1993).
dimana:
d = nilai Durbin Watson ei = jumlah kuadrat sisa
Nilai Durbin Watson kemudian dibandingkan dengan nilai d-tabel. Hasil
perbandingan akan menghasilkan kesimpulan seperti kriteria sebagai
berikut:
1. Jika d < dl, berarti terdapat autokorelasi positif
2. Jika d > (4 dl), berarti terdapat autokorelasi negatif
3. Jika du < d < (4 dl), berarti tidak terdapat autokorelasi
4. Jika dl < d < du atau (4 du), berarti tidak dapat disimpulkan
Berikut ini adalah daerah pengujian durbin watson: