1. Pendahuluan
Pengertian Analisis Regresi Linear :
analisis yang digunakan untuk menjelaskan keterkaitan hubu-
ngan antara suatu variabel bebas (independent) terhadap vari-
abel respon (dependent).
Hubungan antara variabel bebas dengan respon, yang di-anggap
terjadi secara "linear", dapat dibentuk sebagai model.
1
penentuan karakteristik hubungan antar variabel. Berdasarkan pada
model ini, seseorang dapat menentukan arti dan kegunaan serta
arah/pola hubungan antar variabel.
KEGUNAAN :
a) Tingkat konsumsi terhadap suatu produk
(berdasarkan harga produk, pendapatan penduduk, jumlah
penduduk)
b) Volume penjualan
(berdasarkan harga barang, biaya iklan, pendapatan
penduduk, jenis & warna kemasan)
2
regresi dapat membantu para pengelola perusahaan memecahkan
permasalahan manajemennya.
= 0 + 1 Xi + i
Asumsi-asumsi untuk model probabilistik :
Untuk setiap nilai x tertentu, y memiliki suatu distribusi normal,
dengan rata-rata yang diberikan oleh persamaan
E(Yi|Xi) = 0 + 1 Xi
SSE = ( Yi - Ŷ i )2
3
Estimator Kuadrat Terkecil untuk 0 dan 1 adalah :
SS xy
̂1 dan ˆ o Y ˆ1 X
SS x
dimana :
Xi 2
SS x ( X i X ) X i2
2
n
SS xy ( X i X )(Yi Y ) X iYi
X i Yi
n
Contoh 1 :
Andi, manajer pemasaran “PT GALAXY” ingin mengembangkan
model antara harga jual dengan volume penjualannya selama 10
minggu. Data tentang harga jual dan volume penjualan diberikan
pada Tabel 1:
4
Diagram pencar (grafik X dan Y)
20
15
Y
10
XiYi = 149,3
1 = -14,54 0 = 32,14
Persamaan regresinya :
Ŷ = 32,14 14,54 X
Dari model ini dapat diartikan bahwa semakin besar harga jualnya, maka
semakin kecil volume penjualan yang akan diperoleh. Peningkatan satu
satuan harga jual, penurunan volume penjualannya akan sebesar 14.54.
5
5. Menghitung s2, sebagai Penaksir untuk 2
Kegunaan :
Mengukur besarnya simpangan nilai pengamatan Y sebenarnya
dengan nilai taksiran Ŷ (mengukur seberapa jauh titik data me-
nyebar di sekitar garis regresi).
Penaksir untuk 2 :
SSE
ˆ 2 s 2
n2
SS y (Yi Y ) Yi2
2 Yi 2
n
6. Inferensi model
a. Inferensi mengenai konstanta model, 0
Pengujian Hipotesis Mengenai Konstanta suatu Garis linear :
Hipotesis Nol : H0 : 0 = 00
Hipotesis Alternatif : H1 : 0 00
Statistik Uji :
ˆ 0 ˆ 00
t 2
1 x
S
n SS x
6
Daerah Penolakan :
Tolak H0 apabila t > tn-2,/2 atau t -tn-2,/2
Hipotesis Nol : H0 : 1 = 10
Hipotesis Alternatif : H1 : 1 10
Statistik Uji :
ˆ1 ˆ10
t SS x
S
Daerah Penolakan :
Tolak H0 apabila t > tn-2,/2 atau t -tn-2,/2
Contoh 2 :
Berarti H0 ditolak.
7
7. Estimasi E(y|x), nilai yang diharapkan y untuk suatu
nilai x tertentu
Untuk mendapatkan nilai estimasi suatu respon dari suatu variabel
bebas yang diberikan, digunakan persamaan regresi yang telah
diperoleh. Yaitu dengan cara memasukkan nilai x pada per-samaan
tersebut akan didapatkan nilai y.
Contoh 3 :
Misalkan harga produk GALAXY sebesar Rp 1,63 juta. Maka:
Ŷ = 32,14 – 14,54 (1,63) = 8,44 atau 8440 unit.
1 (x p x)
2
s 1
n SS x
( X p X )2
2 kesalahan s 1 1
n SS x
2
1 (x p x)
yˆ t / 2;n 2 s 1
n SS x
8
Contoh 4 :
Dapatkan interval prediksi 95% untuk X = 1,63. Maka :
9. Koefisien Korelasi
Pengertian :
Suatu ukuran (indikator) kekuatan hubungan linear antara dua
variabel y dan x.
SS xy
rxy ; -1 rxy 1
SS x SS y
Contoh 5 :
Dapatkan nilai korelasi dari soal pada Contoh 1, dan apa arti dari
angka tersebut. Maka dari soal diatas diperoleh :
rxy = -0,864
Artinya :
Terdapat hubungan linear negatif yang kuat antara X dan Y.
Jadi dapat disimpulkan bahwa :
jika harga jual naik maka volume penjualan akan turun
9
Pengujian Hipotesis Mengenai hubungan keterkaitan dua
variabel :
Hipotesis Nol : H0 : = 0
Hipotesis Alternatif : H1 : 0
Statistik Uji :
t r n 2
1 r 2
Daerah Penolakan :
Tolak H0 apabila t > tn-2,/2 atau t -tn-2,/2
Contoh 6 :
Dari contoh 1 diperoleh :
R2 = 0,747 ~ 75%
Interpretasi :
a) Tujuh puluh lima persen dari data dapat dijelaskan oleh
model, Ŷ = 32,14 – 14,54X.
b) Tujuh puluh lima persen dari variabilitas volume penjual-an
produk GALAXY dapat dijelaskan oleh variabilitas harga jual
produk GALAXY.
10
c) Variabilitas yang tidak dapat dijelaskan harga jual produk ini
mungkin dijelaskan oleh faktor-faktor lain yang tidak
dimasukkan dalam persamaan regresi, misalnya iklan atau
penghasilan.
R 2 = r2
Dalam terapannya, kedua nilai koefisien tersebut penting dalam analisis
regresi, karena masing-masing mempunyai kelebihan.
11. Asumsi
Yi = 0 + 1 Xi + i
2. X diukur tanpa kesalahan
3. i adalah variabel random sedemikian rupa sehingga untuk suatu
nilai X tertentu,
11
E( i) = 0 dan 2 = 2
dan semua pasangan, I dan j adalah saling bebas dalam arti
probabilistik
Regression Analysis
Analysis of Variance
Source DF SS MS F P
Regression 1 174.18 174.18 23.45 0.000
Error 8 59.42 7.43
Total 9 233.60
12
Normal Probability Plot of the Residuals
(response is volume)
1
Residual
-1
-2
-3
-4
-1 0 1
Normal Score
13
ANALISIS REGRESI DENGAN DUMMY VARIABEL
14
Analysis of Variance
Source DF SS MS F P
Regression 2 86.981 43.491 70.35 0.000
Residual Error 12 7.419 0.618
Total 14 94.400
6
PrstasiKj
0
30 40 50 60 70 80 90 100
TesBakat
15
Koefisien regresi –2,18 hanya berlaku untuk Pria.
Jika seorang Pria mengikuti tes ini maka tingkat prestasi kerja
diramalkan turun 2,18 dengan anggapan nilai tes bakat konstan.
rY,X1 = 0,88 Koefisien korelasi antara prestasi kerja dan tes bakat,
maka R2 = 0,77
rY,X2 = 0,02 Koefisien korelasi antara prestasi kerja dan jenis
kelamin (kecil), artinya tingkat prestasi kerja tidak
dipengaruhi oleh jenis kelamin.
16
Jika hasil tes bakat dan jenis kelamin digunakan secara bersama-
sama untuk memperhatikan prestasi kerja, 92% variasi dapat
dijelaskan. Artinya kedua variabel mempunyai kontribusi penting
bagi peramalan tingkat prestasi kerja.
Validasi Model
17
Contoh kasus collinearitas
Berikut ini adalah data tentang pendapatan tahunan dan jumlah anggota
keluarga yang akan digunakan untuk memproyeksikan besarnya
pengeluaran untuk makanan per tahun.
A 24 11 6
B 8 3 2
C 16 4 1
D 18 7 3
E 24 9 5
F 23 8 4
G 11 5 2
H 15 7 2
I 21 8 3
J 20 7 2
Y X1
X1 0.884
X2 0.737 0.867
18
MTB > Regress 'Y' 1 'X1'
Analysis of Variance
Source DF SS MS F P
Regression 2 213.42 106.71 12.75 0.005
Error 7 58.58 8.37
Total 9 272.00
19
2. Pendapatan dan jumlah anggota keluarga mempunyai korelasi yang
tinggi dan mungkin akan menjelaskan proporsi yang sama dari
pengeluaran untuk makanan. (rX1.X2 = 0,87)
20