Step 1 - Regresi, Dummy, Collinear

ANALISIS REGRESI LINEAR & KORELASI
1. Pendahuluan
Pengertian Analisis Regresi Linear :
analisis yang digunakan untuk menjelaskan keterkaitan hubu-
ngan antara suatu variabel bebas (independent) terhadap vari-
abel respon (dependent).
Hubungan antara variabel bebas dengan respon, yang di-anggap
terjadi secara "linear", dapat dibentuk sebagai model.
Manfaat Analisis Regresi :

Model persamaan regresi dapat digunakan untuk meramalkan
nilai variabel respon jika nilai variabel bebas diketahui
dengan derajat keyakinan tertentu.
Deteksi untuk mengetahui pola model suatu data :

- Hitung koefisien korelasi antara dua variabel
Koefisien korelasi, -1<  < 1, dapat digunakan sebagai nilai kasar
untuk melihat ada tidaknya keterkaitan hubungan antara dua
variabel. (lihat sub 9)
- Grafik antara kedua variabel pengamatan

Jika grafik menunjukkan adanya pola fluktuasi yang linear, maka
dapat dianggap terdapat hubungan linear sederhana antara kedua
variabel tersebut.
- Testing hipotesis pada model

Jika uji tiap parameter model linearnya secara statistik dapat
dianggap signifikan, maka model dapat dianggap benar mem-
bentuk persamaan linear. (lihat sub 6)
2. Kegunaan Bagi Manajemen

Analisis regresi adalah salah satu alat yang paling sering
digunakan dalam manajemen jika diinginkan untuk mengevaluasi
pengaruh suatu variabel bebas terhadap variabel respon. Analisis
regresi dan korelasi dapat membantu dalam melakukan proyeksi
1
penentuan karakteristik hubungan antar variabel. Berdasarkan pada
model ini, seseorang dapat menentukan arti dan kegunaan serta
arah/pola hubungan antar variabel.
KEGUNAAN :
a) Tingkat konsumsi terhadap suatu produk
(berdasarkan harga produk, pendapatan penduduk, jumlah
penduduk)
b) Volume penjualan
(berdasarkan harga barang, biaya iklan, pendapatan
penduduk, jenis & warna kemasan)
c) Harga saham perusahaan jasa listrik

(diukur berdasarkan tingkat bunga utama, laba per- lembar
saham ("earning per share"), tingkat dividen)
d) Jumlah pendapatan dari parkir

(diukur berdasarkan jumlah penduduk, jenis & luas area
parkir, jumlah jukir)
Jika seorang manajer telah mengetahui pola hubungan antara

variabel bebas dan responnya dalam suatu model persamaan maka
manajer tersebut bisa mencoba untuk “mengendalikan” variabel
dependen tersebut berdasarkan pemahaman terhadap persamaan
regresi tersebut.
Misal, seorang manajer pemasaran menentukan bahwa ter-dapat

hubungan positip yang signifikan antara beaya iklan dengan volume
penjualan dan misalkan persamaan regresinya adalah sebagai berikut :
Volume Penjualan = 50 juta + 0,3 (Beaya Iklan)
Berdasarkan persamaan di atas, manajer pemasaran tersebut

dapat memperkirakan volume penjualan yang menghasilkan laba
maksimum dengan cara menambah atau mengurangi beaya iklan
perusahaannya. Jika manajer tersebut dapat mengendalikan variabel
independennya, berarti manajer tersebut juga dapat mengendalikan
variabel dependennya secara parsial. Oleh karena itu, persamaan
2
regresi dapat membantu para pengelola perusahaan memecahkan
permasalahan manajemennya.
3. Model Probabilistik Regresi Linear Sederhana

Model probabilistik untuk setiap nilai y diamati sebagai :
Yi = (nilai rata-rata y utk suatu nilai x tertentu) + (kesalahan acak)
=  0 +  1 Xi +  i
Asumsi-asumsi untuk model probabilistik :
Untuk setiap nilai x tertentu, y memiliki suatu distribusi normal,
dengan rata-rata yang diberikan oleh persamaan
E(Yi|Xi) =  0 +  1 Xi
dan dengan suatu varians 2. Setiap nilai y adalah indepen-den

(bebas) terhadap setiap nilai y yang lainnya.
4. Metode Kuadrat Terkecil ("Least Squares Method")

Prinsip kuadrat terkecil :
Menentukan suatu garis linear dengan kecocokan terbaik yang
me-minimumkan jumlah kuadrat penyimpangan nilai y yang
diamati dari nilai-nilai yang diramalkan.
Secara matematis, ingin diminimumkan :
SSE =  ( Yi - Ŷ i )2
3
Estimator Kuadrat Terkecil untuk  0 dan  1 adalah :
SS xy
̂1  dan ˆ o  Y  ˆ1 X
SS x
dimana :
 Xi  2
SS x   ( X i  X )   X i2 
2
n
SS xy   ( X i  X )(Yi  Y )   X iYi 
  X i  Yi 
n
Contoh 1 :
Andi, manajer pemasaran “PT GALAXY” ingin mengembangkan
model antara harga jual dengan volume penjualannya selama 10
minggu. Data tentang harga jual dan volume penjualan diberikan
pada Tabel 1:
Tabel 1 : Volume Penjualan dan Harga Jual Produk GALAXY
Volume Penjualan Harga Jual

Minggu (1000) (Rp 106)
1 10 1,3
2 6 2,0
3 5 1,7
4 12 1,5
5 10 1,6
6 15 1,2
7 5 1,6
8 12 1,4
9 17 1,0
10 20 1,1
4
Diagram pencar (grafik X dan Y)
20
15
Y
10
1.0 1.5 2.0

X
Gambar 1. Plot antara Penjualan (Y) dan Harga (X)
dari data diatas diperoleh :
Xi = 14,4 Xi2 = 21,56

Yi = 112 Yi = 1488
2
XiYi = 149,3
Sehingga estimasi parameter adalah :
1 = -14,54  0 = 32,14
Persamaan regresinya :
Ŷ = 32,14  14,54 X
Dari model ini dapat diartikan bahwa semakin besar harga jualnya, maka
semakin kecil volume penjualan yang akan diperoleh. Peningkatan satu
satuan harga jual, penurunan volume penjualannya akan sebesar 14.54.
5
5. Menghitung s2, sebagai Penaksir untuk  2
Kegunaan :
Mengukur besarnya simpangan nilai pengamatan Y sebenarnya
dengan nilai taksiran Ŷ (mengukur seberapa jauh titik data me-
nyebar di sekitar garis regresi).
Penaksir untuk 2 :
SSE
ˆ 2  s 2 
n2
dimana : n-2 adalah banyaknya data minus banyaknya parameter

yang ditaksir ( 1 dan  0 ).
SSE  SS y  ˆ1 SS xy
SS y   (Yi  Y )   Yi2 
2  Yi  2
n
Untuk data contoh 1: s = 2,725
6. Inferensi model
a. Inferensi mengenai konstanta model,  0
Pengujian Hipotesis Mengenai Konstanta suatu Garis linear :
 Hipotesis Nol : H0 :  0 =  00
 Hipotesis Alternatif : H1 :  0   00
 Statistik Uji :
ˆ 0  ˆ 00
t 2
1 x
S 
n SS x
6
 Daerah Penolakan :
Tolak H0 apabila t > tn-2,/2 atau t  -tn-2,/2
Latihan : Ujilah konstanta model dari Contoh 1.
b. Inferensi mengenai kemiringan model,  1

Pengujian Hipotesis Mengenai Kemiringan suatu Garis :
 Hipotesis Nol : H0 :  1 =  10
 Hipotesis Alternatif : H1 :  1   10
 Statistik Uji :
ˆ1  ˆ10
t SS x
S
Contoh 2 :
Untuk data contoh 1 :

t = -4,84
 = 5%  t 8,0.025 = 2,306
Berarti H0 ditolak.
Interpretasikan hasil uji hipotesa ini !!!!
7
7. Estimasi E(y|x), nilai yang diharapkan y untuk suatu
nilai x tertentu
Untuk mendapatkan nilai estimasi suatu respon dari suatu variabel
bebas yang diberikan, digunakan persamaan regresi yang telah
diperoleh. Yaitu dengan cara memasukkan nilai x pada per-samaan
tersebut akan didapatkan nilai y.
Contoh 3 :
Misalkan harga produk GALAXY sebesar Rp 1,63 juta. Maka:
Ŷ = 32,14 – 14,54 (1,63) = 8,44 atau 8440 unit.
 Penyimpangan nilai ramalan ini adalah :
1 (x p  x)
2
s 1 
n SS x
dimana xp adalah nilai variabel random yang diberikan. (Lihat sub 8

berikut)
8. Meramalkan nilai y untuk suatu nilai x tertentu

 Kesalahan Baku Peramalan
( X p  X )2
 2 kesalahan  s 1  1 
n SS x
 Selang Peramalan (1- )100% untuk y :
2
1 (x p  x)
yˆ  t / 2;n  2 s 1  
n SS x
8
Contoh 4 :
Dapatkan interval prediksi 95% untuk X = 1,63. Maka :
8,44  2,306 (2,90)  1,75 sampai 15,13
atau antara 1750 sampai 15130 unit.
9. Koefisien Korelasi
Pengertian :
Suatu ukuran (indikator) kekuatan hubungan linear antara dua
variabel y dan x.
 Koefisien Korelasi Perkalian Momen dari Pearson :
SS xy
  rxy  ; -1  rxy  1
SS x SS y
Contoh 5 :
Dapatkan nilai korelasi dari soal pada Contoh 1, dan apa arti dari
angka tersebut. Maka dari soal diatas diperoleh :
rxy = -0,864
Artinya :
Terdapat hubungan linear negatif yang kuat antara X dan Y.
Jadi dapat disimpulkan bahwa :
jika harga jual naik maka volume penjualan akan turun
9
 Pengujian Hipotesis Mengenai hubungan keterkaitan dua
variabel :
 Hipotesis Nol : H0 :  = 0
 Hipotesis Alternatif : H1 :   0
 Statistik Uji :
t  r n 2
1 r 2
10. Koefisien Determinasi
Pengertian Koefisien Determinasi (R2) :

Suatu besaran untuk mengukur persentase variabilitas data yang
dapat dijelaskan oleh model regresi yang diperoleh.
 Rumus Perhitungan Koefisien Determinasi (R2) :

SSE
R2  1 
SS y
Contoh 6 :
Dari contoh 1 diperoleh :
R2 = 0,747 ~ 75%
Interpretasi :
a) Tujuh puluh lima persen dari data dapat dijelaskan oleh
model, Ŷ = 32,14 – 14,54X.
b) Tujuh puluh lima persen dari variabilitas volume penjual-an
produk GALAXY dapat dijelaskan oleh variabilitas harga jual
produk GALAXY.
10
c) Variabilitas yang tidak dapat dijelaskan harga jual produk ini
mungkin dijelaskan oleh faktor-faktor lain yang tidak
dimasukkan dalam persamaan regresi, misalnya iklan atau
penghasilan.
Perhatikan bahwa koefisien determinasi (R2) adalah koefisien

korelasi (r) yang dikuadratkan, sehingga :
R 2 = r2
Dalam terapannya, kedua nilai koefisien tersebut penting dalam analisis
regresi, karena masing-masing mempunyai kelebihan.
 Keunggulan koefisiein korelasi (r) adalah

bahwa koefisien ini dapat menunjukkan dua macam hu-
bungan : “positip dan negatip”, antara dua variabel
 Keunggulan koefisien determinasi (R2) adalah

koefisien ini mengandung interpretasi yang berguna untuk me-
ngukur persentase variabilitas Y yang dijelaskan oleh variabili-tas
X.
11. Asumsi
 Asumsi untuk Analisis Regresi
1. Reaksi y dapat dinyatakan dengan logis sebagai model

probabilistik
Yi =  0 +  1 Xi +  i
2. X diukur tanpa kesalahan
3. i adalah variabel random sedemikian rupa sehingga untuk suatu
nilai X tertentu,
11
E( i) = 0 dan  2 =  2
dan semua pasangan,  I dan  j adalah saling bebas dalam arti
probabilistik
4. i memiliki suatu distribusi probabilitas normal (IIDN(0, 2))
12. Hasil analisis dengan MINITAB

MTB > Regress 'volume' 1 'harga';
SUBC> Constant.
Regression Analysis
The regression equation is

volume = 32.1 - 14.5 harga
Predictor Coef StDev T P

Constant 32.136 4.409 7.29 0.000
harga -14.539 3.002 -4.84 0.000
S = 2.725 R-Sq = 74.6% R-Sq(adj) = 71.4%
Analysis of Variance
Source DF SS MS F P
Regression 1 174.18 174.18 23.45 0.000
Error 8 59.42 7.43
Total 9 233.60
12
Normal Probability Plot of the Residuals
(response is volume)
1
Residual
-1
-2
-3
-4
-1 0 1
Normal Score
13
ANALISIS REGRESI DENGAN DUMMY VARIABEL
Diketahui data untuk pengujian pengaruh PRESTASI KERJA oleh

BAKAT yang juga dicurigai akan dipengaruhi oleh perbedaan JENIS
KELAMIN, sebagai berikut:
PrstasiKj TesBakat Sex
5 60 0
4 55 0
3 35 0
10 96 0
2 35 0
7 81 0
6 65 0
9 85 0
9 99 1
2 43 1
8 98 1
6 91 1
7 95 1
3 70 1
6 85 1
Jika diolah dengan MINITAB diperoleh hasil sebagai

berikut:
Results for: DUMMY-PRESTASIKERJA-BAKAT.MTW
Regression Analysis: PrstasiKj versus TesBakat, Sex

PrstasiKj = - 1.96 + 0.120 TesBakat - 2.18 Sex
Predictor Coef SE Coef T P

Constant -1.9565 0.7068 -2.77 0.017
TesBakat 0.12041 0.01015 11.86 0.000
Sex -2.1807 0.4503 -4.84 0.000
S = 0.786263 R-Sq = 92.1% R-Sq(adj) = 90.8%
14
Source DF SS MS F P
Regression 2 86.981 43.491 70.35 0.000
Residual Error 12 7.419 0.618
Total 14 94.400
Plot dari kedua model adalah sebagai berikut:
Scatterplot of PrstasiKj vs TesBakat

Sex
10
0
1
6
PrstasiKj
0
30 40 50 60 70 80 90 100
TesBakat
 Interpretasi model regresi (dengan DUMMY Variabel):
 Y = -1,96 + 0,12 X1 – 2,18 (0) Wanita

Y = -1,96 + 0,12 X1 – 2,18 (1) Pria
 Koefisien 0,12 berarti :

Peningkatan nilai rata-rata tingkat prestasi kerja untuk setiap kenaikan
nilai tes bakat sebesar 1 unit (berlaku untuk Wanita dan Pria)
15
 Koefisien regresi –2,18 hanya berlaku untuk Pria.
Jika seorang Pria mengikuti tes ini maka tingkat prestasi kerja
diramalkan turun 2,18 dengan anggapan nilai tes bakat konstan.
 Dari hasil hal 2 :

a. Rata-rata tingkat prestasi kerja (5,86) tidak jauh berbeda dengan
Wanita (5,75).
b. Tetapi rata-rata nilai tes bakat Pria (83) secara signifikan lebih
tinggi dari nilai tes wanita (64).
c. Jika ada 2 pekerja, yang satu Wanita dan satu Pria mengikuti tes
dan keduanya mendapatkan nilai 70, maka estimasi tingkat
prestasi kerja wanita akan lebih tinggi 2,18 unit.
Y = -1,96 + 0,12 (70) = 6,44 Wanita

Y = -4,14 + 0,12 (70) = 4,26 Pria
 Dari hasil korelasi seperti pada tabel berikut :
(1) (2) (3)

Prestasi Test Bakat Sex
(1) Prestasi 1.000 0.876 0.021

(2) Test Bakat 1.000 0.876
(3) Sex 1.000
rY,X1 = 0,88  Koefisien korelasi antara prestasi kerja dan tes bakat,
maka R2 = 0,77
rY,X2 = 0,02  Koefisien korelasi antara prestasi kerja dan jenis
kelamin (kecil), artinya tingkat prestasi kerja tidak
dipengaruhi oleh jenis kelamin.
16
 Jika hasil tes bakat dan jenis kelamin digunakan secara bersama-
sama untuk memperhatikan prestasi kerja, 92% variasi dapat
dijelaskan. Artinya kedua variabel mempunyai kontribusi penting
bagi peramalan tingkat prestasi kerja.
 Validasi Model
Beberapa asumsi yang harus dipenuhi pada model regresi berganda:
1. Data (residual  respon) berdistribusi normal

Dibutuhkan untuk membentuk uji t dan F pada kesesuaian model.
Jika ukuran sampel cukup besar (30 atau lebih), maka teorema
limit central memberikan rasionalisai untuk asumsi kenormalan ini.
2. Sebaran data pada suatu titik adalah konstan.

Heteroskedastisitas adalah situasi dimana error atau residual tidak
mempunyai varians konstan.
3. Pengamatan X-Y adalah suatu sampel random (independen)

Collinearity adalah situasi dimana ada korelasi yang tinggi antar
variabel independen pada model regresi berganda.
4. Adanya suatu hubungan linear antara X-Y
17
 Contoh kasus collinearitas
Berikut ini adalah data tentang pendapatan tahunan dan jumlah anggota
keluarga yang akan digunakan untuk memproyeksikan besarnya
pengeluaran untuk makanan per tahun.
Pengeluaran Pendapatan Jumlah anggota

Keluarga (ratusan ribu) (juta) keluarga
A 24 11 6
B 8 3 2
C 16 4 1
D 18 7 3
E 24 9 5
F 23 8 4
G 11 5 2
H 15 7 2
I 21 8 3
J 20 7 2
Hasil dengan MINITAB diperoleh :

Y = Pengeluaran
X1 = Pendapatan
X2 = Jumlah anggota keluarga
MTB > correlation c1-c3
Y X1
X1 0.884
X2 0.737 0.867
18
MTB > Regress 'Y' 1 'X1'

Y = 3.90 + 2.04 X1
S = 2.727 R-Sq = 78.1% R-Sq(adj) = 75.4%
MTB > Regress 'Y' 2 'X1' 'X2';

SUBC> Constant.
Y = 3.52 + 2.28 X1 - 0.41 X2
Predictor Coef StDev T P

Constant 3.519 3.161 1.11 0.302
X1 2.2776 0.8126 2.80 0.026
X2 -0.411 1.236 -0.33 0.749
S = 2.893 R-Sq = 78.5% R-Sq(adj) = 72.3%
Source DF SS MS F P
Regression 2 213.42 106.71 12.75 0.005
Error 7 58.58 8.37
Total 9 272.00
 Interpretasi model regresi (kasus kolinearitas):
1. Kedua variabel, pendapatan dan jumlah anggota keluarga

mempunyai korelasi positif dengan pengeluaran untuk makanan dan
merupakan variabel prediktor yang potensial untuk proyeksi
pengeluaran tersebut. (rYX1 = 0,88 dan rYX2 = 0,74)
19
2. Pendapatan dan jumlah anggota keluarga mempunyai korelasi yang
tinggi dan mungkin akan menjelaskan proporsi yang sama dari
pengeluaran untuk makanan. (rX1.X2 = 0,87)
3. Hasil dari model regresi menunjukkan bahwa koefisien regresi untuk

jumlah anggota keluarga adalah negatif (-0,41). Hasil ini adalah tidak
logis, khususnya kalau kita perhatikan kembali matriks korelasi antara
jumlah anggota keluarga dan pengeluaran untuk makanan ini, yaitu
berkorelasi positif (0,74).
4. Jika hanya pendapatan yang digunakan untuk memproyeksikan

besarnya pengeluaran untuk makanan, 78,1% (0,8842) dari variasi
data dapat dijelaskan. Ketika jumlah anggota keluarga ditambahkan,
R2 hanya bertambah menjadi 78,5%. Hal ini adalah bukti bahwa
jumlah anggota keluarga menjelaskan variasi yang sama seperti
pendapatan.
20

Step 1 - Regresi, Dummy, Collinear

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Step 1 - Regresi, Dummy, Collinear

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS REGRESI LINEAR & KORELASI

Manfaat Analisis Regresi :

Deteksi untuk mengetahui pola model suatu data :

- Grafik antara kedua variabel pengamatan

- Testing hipotesis pada model

2. Kegunaan Bagi Manajemen

c) Harga saham perusahaan jasa listrik

d) Jumlah pendapatan dari parkir

Jika seorang manajer telah mengetahui pola hubungan antara

Misal, seorang manajer pemasaran menentukan bahwa ter-dapat

Volume Penjualan = 50 juta + 0,3 (Beaya Iklan)

Berdasarkan persamaan di atas, manajer pemasaran tersebut

3. Model Probabilistik Regresi Linear Sederhana

Yi = (nilai rata-rata y utk suatu nilai x tertentu) + (kesalahan acak)

dan dengan suatu varians 2. Setiap nilai y adalah indepen-den

4. Metode Kuadrat Terkecil ("Least Squares Method")

Secara matematis, ingin diminimumkan :

Tabel 1 : Volume Penjualan dan Harga Jual Produk GALAXY

Volume Penjualan Harga Jual

1.0 1.5 2.0

Gambar 1. Plot antara Penjualan (Y) dan Harga (X)

dari data diatas diperoleh :

Xi = 14,4 Xi2 = 21,56

Sehingga estimasi parameter adalah :

dimana : n-2 adalah banyaknya data minus banyaknya parameter

Untuk data contoh 1: s = 2,725

Latihan : Ujilah konstanta model dari Contoh 1.

b. Inferensi mengenai kemiringan model,  1

Untuk data contoh 1 :

Interpretasikan hasil uji hipotesa ini !!!!

 Penyimpangan nilai ramalan ini adalah :

dimana xp adalah nilai variabel random yang diberikan. (Lihat sub 8

8. Meramalkan nilai y untuk suatu nilai x tertentu

 Selang Peramalan (1- )100% untuk y :

8,44  2,306 (2,90)  1,75 sampai 15,13

atau antara 1750 sampai 15130 unit.

 Koefisien Korelasi Perkalian Momen dari Pearson :

10. Koefisien Determinasi

Pengertian Koefisien Determinasi (R2) :

 Rumus Perhitungan Koefisien Determinasi (R2) :

Perhatikan bahwa koefisien determinasi (R2) adalah koefisien

 Keunggulan koefisiein korelasi (r) adalah

 Keunggulan koefisien determinasi (R2) adalah

 Asumsi untuk Analisis Regresi

1. Reaksi y dapat dinyatakan dengan logis sebagai model

4. i memiliki suatu distribusi probabilitas normal (IIDN(0, 2))

12. Hasil analisis dengan MINITAB

The regression equation is

Predictor Coef StDev T P

S = 2.725 R-Sq = 74.6% R-Sq(adj) = 71.4%

Diketahui data untuk pengujian pengaruh PRESTASI KERJA oleh

Jika diolah dengan MINITAB diperoleh hasil sebagai

Regression Analysis: PrstasiKj versus TesBakat, Sex

The regression equation is

Predictor Coef SE Coef T P

S = 0.786263 R-Sq = 92.1% R-Sq(adj) = 90.8%

Plot dari kedua model adalah sebagai berikut:

Scatterplot of PrstasiKj vs TesBakat

 Interpretasi model regresi (dengan DUMMY Variabel):

 Y = -1,96 + 0,12 X1 – 2,18 (0) Wanita

 Koefisien 0,12 berarti :

 Dari hasil hal 2 :

Y = -1,96 + 0,12 (70) = 6,44 Wanita

 Dari hasil korelasi seperti pada tabel berikut :