Anda di halaman 1dari 20

ANALISIS REGRESI LINEAR & KORELASI

1. Pendahuluan
Pengertian Analisis Regresi Linear :
analisis yang digunakan untuk menjelaskan keterkaitan hubu-
ngan antara suatu variabel bebas (independent) terhadap vari-
abel respon (dependent).
Hubungan antara variabel bebas dengan respon, yang di-anggap
terjadi secara "linear", dapat dibentuk sebagai model.

Manfaat Analisis Regresi :


Model persamaan regresi dapat digunakan untuk meramalkan
nilai variabel respon jika nilai variabel bebas diketahui
dengan derajat keyakinan tertentu.

Deteksi untuk mengetahui pola model suatu data :


- Hitung koefisien korelasi antara dua variabel
Koefisien korelasi, -1<  < 1, dapat digunakan sebagai nilai kasar
untuk melihat ada tidaknya keterkaitan hubungan antara dua
variabel. (lihat sub 9)

- Grafik antara kedua variabel pengamatan


Jika grafik menunjukkan adanya pola fluktuasi yang linear, maka
dapat dianggap terdapat hubungan linear sederhana antara kedua
variabel tersebut.

- Testing hipotesis pada model


Jika uji tiap parameter model linearnya secara statistik dapat
dianggap signifikan, maka model dapat dianggap benar mem-
bentuk persamaan linear. (lihat sub 6)

2. Kegunaan Bagi Manajemen


Analisis regresi adalah salah satu alat yang paling sering
digunakan dalam manajemen jika diinginkan untuk mengevaluasi
pengaruh suatu variabel bebas terhadap variabel respon. Analisis
regresi dan korelasi dapat membantu dalam melakukan proyeksi

1
penentuan karakteristik hubungan antar variabel. Berdasarkan pada
model ini, seseorang dapat menentukan arti dan kegunaan serta
arah/pola hubungan antar variabel.

KEGUNAAN :
a) Tingkat konsumsi terhadap suatu produk
(berdasarkan harga produk, pendapatan penduduk, jumlah
penduduk)

b) Volume penjualan
(berdasarkan harga barang, biaya iklan, pendapatan
penduduk, jenis & warna kemasan)

c) Harga saham perusahaan jasa listrik


(diukur berdasarkan tingkat bunga utama, laba per- lembar
saham ("earning per share"), tingkat dividen)

d) Jumlah pendapatan dari parkir


(diukur berdasarkan jumlah penduduk, jenis & luas area
parkir, jumlah jukir)

Jika seorang manajer telah mengetahui pola hubungan antara


variabel bebas dan responnya dalam suatu model persamaan maka
manajer tersebut bisa mencoba untuk “mengendalikan” variabel
dependen tersebut berdasarkan pemahaman terhadap persamaan
regresi tersebut.

Misal, seorang manajer pemasaran menentukan bahwa ter-dapat


hubungan positip yang signifikan antara beaya iklan dengan volume
penjualan dan misalkan persamaan regresinya adalah sebagai berikut :

Volume Penjualan = 50 juta + 0,3 (Beaya Iklan)

Berdasarkan persamaan di atas, manajer pemasaran tersebut


dapat memperkirakan volume penjualan yang menghasilkan laba
maksimum dengan cara menambah atau mengurangi beaya iklan
perusahaannya. Jika manajer tersebut dapat mengendalikan variabel
independennya, berarti manajer tersebut juga dapat mengendalikan
variabel dependennya secara parsial. Oleh karena itu, persamaan

2
regresi dapat membantu para pengelola perusahaan memecahkan
permasalahan manajemennya.

3. Model Probabilistik Regresi Linear Sederhana


Model probabilistik untuk setiap nilai y diamati sebagai :

Yi = (nilai rata-rata y utk suatu nilai x tertentu) + (kesalahan acak)

=  0 +  1 Xi +  i
Asumsi-asumsi untuk model probabilistik :
Untuk setiap nilai x tertentu, y memiliki suatu distribusi normal,
dengan rata-rata yang diberikan oleh persamaan

E(Yi|Xi) =  0 +  1 Xi

dan dengan suatu varians 2. Setiap nilai y adalah indepen-den


(bebas) terhadap setiap nilai y yang lainnya.

4. Metode Kuadrat Terkecil ("Least Squares Method")


Prinsip kuadrat terkecil :
Menentukan suatu garis linear dengan kecocokan terbaik yang
me-minimumkan jumlah kuadrat penyimpangan nilai y yang
diamati dari nilai-nilai yang diramalkan.

Secara matematis, ingin diminimumkan :

SSE =  ( Yi - Ŷ i )2

3
Estimator Kuadrat Terkecil untuk  0 dan  1 adalah :

SS xy
̂1  dan ˆ o  Y  ˆ1 X
SS x

dimana :
 Xi  2
SS x   ( X i  X )   X i2 
2
n

SS xy   ( X i  X )(Yi  Y )   X iYi 
  X i  Yi 
n

Contoh 1 :
Andi, manajer pemasaran “PT GALAXY” ingin mengembangkan
model antara harga jual dengan volume penjualannya selama 10
minggu. Data tentang harga jual dan volume penjualan diberikan
pada Tabel 1:

Tabel 1 : Volume Penjualan dan Harga Jual Produk GALAXY

Volume Penjualan Harga Jual


Minggu (1000) (Rp 106)
1 10 1,3
2 6 2,0
3 5 1,7
4 12 1,5
5 10 1,6
6 15 1,2
7 5 1,6
8 12 1,4
9 17 1,0
10 20 1,1

4
Diagram pencar (grafik X dan Y)

20

15
Y

10

1.0 1.5 2.0


X

Gambar 1. Plot antara Penjualan (Y) dan Harga (X)

dari data diatas diperoleh :

Xi = 14,4 Xi2 = 21,56


Yi = 112 Yi = 1488
2

XiYi = 149,3

Sehingga estimasi parameter adalah :

1 = -14,54  0 = 32,14

Persamaan regresinya :

Ŷ = 32,14  14,54 X

Dari model ini dapat diartikan bahwa semakin besar harga jualnya, maka
semakin kecil volume penjualan yang akan diperoleh. Peningkatan satu
satuan harga jual, penurunan volume penjualannya akan sebesar 14.54.

5
5. Menghitung s2, sebagai Penaksir untuk  2
Kegunaan :
Mengukur besarnya simpangan nilai pengamatan Y sebenarnya
dengan nilai taksiran Ŷ (mengukur seberapa jauh titik data me-
nyebar di sekitar garis regresi).

Penaksir untuk 2 :
SSE
ˆ 2  s 2 
n2

dimana : n-2 adalah banyaknya data minus banyaknya parameter


yang ditaksir ( 1 dan  0 ).
SSE  SS y  ˆ1 SS xy

SS y   (Yi  Y )   Yi2 
2  Yi  2
n

Untuk data contoh 1: s = 2,725

6. Inferensi model
a. Inferensi mengenai konstanta model,  0
Pengujian Hipotesis Mengenai Konstanta suatu Garis linear :

 Hipotesis Nol : H0 :  0 =  00

 Hipotesis Alternatif : H1 :  0   00

 Statistik Uji :
ˆ 0  ˆ 00
t 2
1 x
S 
n SS x

6
 Daerah Penolakan :
Tolak H0 apabila t > tn-2,/2 atau t  -tn-2,/2

Latihan : Ujilah konstanta model dari Contoh 1.

b. Inferensi mengenai kemiringan model,  1


Pengujian Hipotesis Mengenai Kemiringan suatu Garis :

 Hipotesis Nol : H0 :  1 =  10

 Hipotesis Alternatif : H1 :  1   10

 Statistik Uji :

ˆ1  ˆ10
t SS x
S

 Daerah Penolakan :
Tolak H0 apabila t > tn-2,/2 atau t  -tn-2,/2

Contoh 2 :

Untuk data contoh 1 :


t = -4,84
 = 5%  t 8,0.025 = 2,306

Berarti H0 ditolak.

Interpretasikan hasil uji hipotesa ini !!!!

7
7. Estimasi E(y|x), nilai yang diharapkan y untuk suatu
nilai x tertentu
Untuk mendapatkan nilai estimasi suatu respon dari suatu variabel
bebas yang diberikan, digunakan persamaan regresi yang telah
diperoleh. Yaitu dengan cara memasukkan nilai x pada per-samaan
tersebut akan didapatkan nilai y.

Contoh 3 :
Misalkan harga produk GALAXY sebesar Rp 1,63 juta. Maka:
Ŷ = 32,14 – 14,54 (1,63) = 8,44 atau 8440 unit.

 Penyimpangan nilai ramalan ini adalah :

1 (x p  x)
2

s 1 
n SS x

dimana xp adalah nilai variabel random yang diberikan. (Lihat sub 8


berikut)

8. Meramalkan nilai y untuk suatu nilai x tertentu


 Kesalahan Baku Peramalan

( X p  X )2
 2 kesalahan  s 1  1 
n SS x

 Selang Peramalan (1- )100% untuk y :

2
1 (x p  x)
yˆ  t / 2;n  2 s 1  
n SS x

8
Contoh 4 :
Dapatkan interval prediksi 95% untuk X = 1,63. Maka :

8,44  2,306 (2,90)  1,75 sampai 15,13

atau antara 1750 sampai 15130 unit.

9. Koefisien Korelasi

Pengertian :
Suatu ukuran (indikator) kekuatan hubungan linear antara dua
variabel y dan x.

 Koefisien Korelasi Perkalian Momen dari Pearson :

SS xy
  rxy  ; -1  rxy  1
SS x SS y

Contoh 5 :
Dapatkan nilai korelasi dari soal pada Contoh 1, dan apa arti dari
angka tersebut. Maka dari soal diatas diperoleh :

rxy = -0,864

Artinya :
Terdapat hubungan linear negatif yang kuat antara X dan Y.
Jadi dapat disimpulkan bahwa :
jika harga jual naik maka volume penjualan akan turun

9
 Pengujian Hipotesis Mengenai hubungan keterkaitan dua
variabel :

 Hipotesis Nol : H0 :  = 0

 Hipotesis Alternatif : H1 :   0

 Statistik Uji :
t  r n 2
1 r 2

 Daerah Penolakan :
Tolak H0 apabila t > tn-2,/2 atau t  -tn-2,/2

10. Koefisien Determinasi

Pengertian Koefisien Determinasi (R2) :


Suatu besaran untuk mengukur persentase variabilitas data yang
dapat dijelaskan oleh model regresi yang diperoleh.

 Rumus Perhitungan Koefisien Determinasi (R2) :


SSE
R2  1 
SS y

Contoh 6 :
Dari contoh 1 diperoleh :
R2 = 0,747 ~ 75%
Interpretasi :
a) Tujuh puluh lima persen dari data dapat dijelaskan oleh
model, Ŷ = 32,14 – 14,54X.
b) Tujuh puluh lima persen dari variabilitas volume penjual-an
produk GALAXY dapat dijelaskan oleh variabilitas harga jual
produk GALAXY.

10
c) Variabilitas yang tidak dapat dijelaskan harga jual produk ini
mungkin dijelaskan oleh faktor-faktor lain yang tidak
dimasukkan dalam persamaan regresi, misalnya iklan atau
penghasilan.

Perhatikan bahwa koefisien determinasi (R2) adalah koefisien


korelasi (r) yang dikuadratkan, sehingga :

R 2 = r2
Dalam terapannya, kedua nilai koefisien tersebut penting dalam analisis
regresi, karena masing-masing mempunyai kelebihan.

 Keunggulan koefisiein korelasi (r) adalah


bahwa koefisien ini dapat menunjukkan dua macam hu-
bungan : “positip dan negatip”, antara dua variabel

 Keunggulan koefisien determinasi (R2) adalah


koefisien ini mengandung interpretasi yang berguna untuk me-
ngukur persentase variabilitas Y yang dijelaskan oleh variabili-tas
X.

11. Asumsi

 Asumsi untuk Analisis Regresi

1. Reaksi y dapat dinyatakan dengan logis sebagai model


probabilistik

Yi =  0 +  1 Xi +  i
2. X diukur tanpa kesalahan
3. i adalah variabel random sedemikian rupa sehingga untuk suatu
nilai X tertentu,

11
E( i) = 0 dan  2 =  2
dan semua pasangan,  I dan  j adalah saling bebas dalam arti
probabilistik

4. i memiliki suatu distribusi probabilitas normal (IIDN(0, 2))

12. Hasil analisis dengan MINITAB


MTB > Regress 'volume' 1 'harga';
SUBC> Constant.

Regression Analysis

The regression equation is


volume = 32.1 - 14.5 harga

Predictor Coef StDev T P


Constant 32.136 4.409 7.29 0.000
harga -14.539 3.002 -4.84 0.000

S = 2.725 R-Sq = 74.6% R-Sq(adj) = 71.4%

Analysis of Variance

Source DF SS MS F P
Regression 1 174.18 174.18 23.45 0.000
Error 8 59.42 7.43
Total 9 233.60

12
Normal Probability Plot of the Residuals
(response is volume)

1
Residual

-1

-2

-3

-4
-1 0 1

Normal Score

13
ANALISIS REGRESI DENGAN DUMMY VARIABEL

Diketahui data untuk pengujian pengaruh PRESTASI KERJA oleh


BAKAT yang juga dicurigai akan dipengaruhi oleh perbedaan JENIS
KELAMIN, sebagai berikut:
PrstasiKj TesBakat Sex
5 60 0
4 55 0
3 35 0
10 96 0
2 35 0
7 81 0
6 65 0
9 85 0
9 99 1
2 43 1
8 98 1
6 91 1
7 95 1
3 70 1
6 85 1

Jika diolah dengan MINITAB diperoleh hasil sebagai


berikut:
Results for: DUMMY-PRESTASIKERJA-BAKAT.MTW

Regression Analysis: PrstasiKj versus TesBakat, Sex

The regression equation is


PrstasiKj = - 1.96 + 0.120 TesBakat - 2.18 Sex

Predictor Coef SE Coef T P


Constant -1.9565 0.7068 -2.77 0.017
TesBakat 0.12041 0.01015 11.86 0.000
Sex -2.1807 0.4503 -4.84 0.000

S = 0.786263 R-Sq = 92.1% R-Sq(adj) = 90.8%

14
Analysis of Variance

Source DF SS MS F P
Regression 2 86.981 43.491 70.35 0.000
Residual Error 12 7.419 0.618
Total 14 94.400

Plot dari kedua model adalah sebagai berikut:

Scatterplot of PrstasiKj vs TesBakat


Sex
10
0
1

6
PrstasiKj

0
30 40 50 60 70 80 90 100
TesBakat

 Interpretasi model regresi (dengan DUMMY Variabel):

 Y = -1,96 + 0,12 X1 – 2,18 (0) Wanita


Y = -1,96 + 0,12 X1 – 2,18 (1) Pria

 Koefisien 0,12 berarti :


Peningkatan nilai rata-rata tingkat prestasi kerja untuk setiap kenaikan
nilai tes bakat sebesar 1 unit (berlaku untuk Wanita dan Pria)

15
 Koefisien regresi –2,18 hanya berlaku untuk Pria.
Jika seorang Pria mengikuti tes ini maka tingkat prestasi kerja
diramalkan turun 2,18 dengan anggapan nilai tes bakat konstan.

 Dari hasil hal 2 :


a. Rata-rata tingkat prestasi kerja (5,86) tidak jauh berbeda dengan
Wanita (5,75).
b. Tetapi rata-rata nilai tes bakat Pria (83) secara signifikan lebih
tinggi dari nilai tes wanita (64).
c. Jika ada 2 pekerja, yang satu Wanita dan satu Pria mengikuti tes
dan keduanya mendapatkan nilai 70, maka estimasi tingkat
prestasi kerja wanita akan lebih tinggi 2,18 unit.

Y = -1,96 + 0,12 (70) = 6,44 Wanita


Y = -4,14 + 0,12 (70) = 4,26 Pria

 Dari hasil korelasi seperti pada tabel berikut :

(1) (2) (3)


Prestasi Test Bakat Sex

(1) Prestasi 1.000 0.876 0.021


(2) Test Bakat 1.000 0.876
(3) Sex 1.000

rY,X1 = 0,88  Koefisien korelasi antara prestasi kerja dan tes bakat,
maka R2 = 0,77
rY,X2 = 0,02  Koefisien korelasi antara prestasi kerja dan jenis
kelamin (kecil), artinya tingkat prestasi kerja tidak
dipengaruhi oleh jenis kelamin.

16
 Jika hasil tes bakat dan jenis kelamin digunakan secara bersama-
sama untuk memperhatikan prestasi kerja, 92% variasi dapat
dijelaskan. Artinya kedua variabel mempunyai kontribusi penting
bagi peramalan tingkat prestasi kerja.

 Validasi Model

Beberapa asumsi yang harus dipenuhi pada model regresi berganda:

1. Data (residual  respon) berdistribusi normal


Dibutuhkan untuk membentuk uji t dan F pada kesesuaian model.
Jika ukuran sampel cukup besar (30 atau lebih), maka teorema
limit central memberikan rasionalisai untuk asumsi kenormalan ini.

2. Sebaran data pada suatu titik adalah konstan.


Heteroskedastisitas adalah situasi dimana error atau residual tidak
mempunyai varians konstan.

3. Pengamatan X-Y adalah suatu sampel random (independen)


Collinearity adalah situasi dimana ada korelasi yang tinggi antar
variabel independen pada model regresi berganda.

4. Adanya suatu hubungan linear antara X-Y

17
 Contoh kasus collinearitas

Berikut ini adalah data tentang pendapatan tahunan dan jumlah anggota
keluarga yang akan digunakan untuk memproyeksikan besarnya
pengeluaran untuk makanan per tahun.

Pengeluaran Pendapatan Jumlah anggota


Keluarga (ratusan ribu) (juta) keluarga

A 24 11 6
B 8 3 2
C 16 4 1
D 18 7 3
E 24 9 5
F 23 8 4
G 11 5 2
H 15 7 2
I 21 8 3
J 20 7 2

Hasil dengan MINITAB diperoleh :


Y = Pengeluaran
X1 = Pendapatan
X2 = Jumlah anggota keluarga

MTB > correlation c1-c3

Y X1
X1 0.884
X2 0.737 0.867

18
MTB > Regress 'Y' 1 'X1'

The regression equation is


Y = 3.90 + 2.04 X1
S = 2.727 R-Sq = 78.1% R-Sq(adj) = 75.4%

MTB > Regress 'Y' 2 'X1' 'X2';


SUBC> Constant.
The regression equation is
Y = 3.52 + 2.28 X1 - 0.41 X2

Predictor Coef StDev T P


Constant 3.519 3.161 1.11 0.302
X1 2.2776 0.8126 2.80 0.026
X2 -0.411 1.236 -0.33 0.749

S = 2.893 R-Sq = 78.5% R-Sq(adj) = 72.3%

Analysis of Variance
Source DF SS MS F P
Regression 2 213.42 106.71 12.75 0.005
Error 7 58.58 8.37
Total 9 272.00

 Interpretasi model regresi (kasus kolinearitas):

1. Kedua variabel, pendapatan dan jumlah anggota keluarga


mempunyai korelasi positif dengan pengeluaran untuk makanan dan
merupakan variabel prediktor yang potensial untuk proyeksi
pengeluaran tersebut. (rYX1 = 0,88 dan rYX2 = 0,74)

19
2. Pendapatan dan jumlah anggota keluarga mempunyai korelasi yang
tinggi dan mungkin akan menjelaskan proporsi yang sama dari
pengeluaran untuk makanan. (rX1.X2 = 0,87)

3. Hasil dari model regresi menunjukkan bahwa koefisien regresi untuk


jumlah anggota keluarga adalah negatif (-0,41). Hasil ini adalah tidak
logis, khususnya kalau kita perhatikan kembali matriks korelasi antara
jumlah anggota keluarga dan pengeluaran untuk makanan ini, yaitu
berkorelasi positif (0,74).

4. Jika hanya pendapatan yang digunakan untuk memproyeksikan


besarnya pengeluaran untuk makanan, 78,1% (0,8842) dari variasi
data dapat dijelaskan. Ketika jumlah anggota keluarga ditambahkan,
R2 hanya bertambah menjadi 78,5%. Hal ini adalah bukti bahwa
jumlah anggota keluarga menjelaskan variasi yang sama seperti
pendapatan.

20

Anda mungkin juga menyukai