dan Korelasi
Analisis Regresi Linear Sederhana
Kegunaan: Model Regression dapat digunakan untuk
memprediksi nilai variabel dependen yang dinyatakan
sebagai fungsi dari variabel independen setelah model
lolos dari analisis.
variabel :
X = variabel independen (dapat ditentukan
dari awal)
Y = variabel dependen(didapat berdasarkan
observasi)
Parameters:
β0 = titik potong sumbu Y
β1 = slop/ kemiringan
galat ε ~ variabel acak bersebaran normal (με
= 0, σε = konstan)
Efek keragaman data terhadap σε
Harga rumah
25K$
Ukuran rumah
Model Linear secara Teoritis
Tahapan Analisis Regresi– Pengumpulan Data
Ranking Test 2 = β0 + β1*(Ranking Test 1) Student Test 1 Test 2
1 50 32
2 51 33
3 52 34
β0 7
8
56
57
39
40
9 58 41
β1 10
11
59
60
42
43
12 61 44
σε 13
14
62
63
46
47
15 64 48
16 65 49
17 66 50
18 67 51
19 68 53
20 69 54
21 70 55
22 71 56
23 72 57
Tahapan Analisis Regresi – olah data awal
80 82
Test B2
Test 2
60 72
40 62
20 52
0 42
40 50 60 70 80 90 100 60 70 80 90 100
Test 1 Test B1
Plot of Fitted Model
100
90
Test B2
80
70
60
50
50 60 70 80 90 100
Test B1
Tahapan Analisis Regresi – Analisis Korelasi… “-1 < < 1”
Jika ingin diketahui apakah ada keterkaitan fungsional antara variabel
dependen dan independen, dihitung nilai koefisien korelasi. Contoh:
keterkaitan antara tinggi dan berat badan .
Plot of Height vs Weight Plot of Height vs Weight
7
7
6.6
6.2 6.6
Height
Height
5.8 6.2
5.4
5 5.8
4.6 5.4
100 140 180 220 260 100 140 180 220 260
Weight Weight
Plot of Height vs Weight Plot of Height vs Weight
6.8 6.6
6.5
6.2
Height
Height
6.2
5.8
5.9
5.6 5.4
5.3 5
100 140 180 220 260
100 140 180 220 260
Weight Weight
Tahapan Analisis Regresi – Analisis Korelasi…
Jika koefisien korelasi mendekati +1 berarti
terdapat keterkaitan antara dua variabel secara
searah.
Jika koefisien korelasi mendekati -1 berarti
terdapat keterkaitan antara dua variabel secara
berlawanan arah.
Jika koefisien korelasi mendekati 0 berarti tidak
terdapat keterkaitan antara dua variabel .
Untuk menilai apakah korelasi antar variabel signifikan
dapat digunakan pengujian hipothesis.
Model Deterministik
Nilai variabel dependen hanya dikaitkan dengan
nilai variabel independen dalam bentuk sebuah
persamaan linear
y = 25,000 + (75/m2)(x)
Model Probabilistik : Nilai variabel dependen
dikaitkan dengan nilai variabel independen dan
suatu variabel acak dalam bentuk sebuah
persamaan linear –Variabel acak mengakomodasi
fenomena realitas data.
y = 25,000 + 75x + ε
Contoh: Tidak semua rumah dengan luasan sama
dijual dengan harga sama
Model Regresi Linear Sederhana…
Arti dari dan
> 0 [kemiringan positif] < 0 [kemiringan negatif]
tegak
datar
= slope (=tegak/datar)
x
Garis apa yang adalah best “fit” untuk data?
?
Estimasi Koefisien Regresi…
Sama halnya dengan sebelumnya, nilai tengah
populasi diduga menggunakan rerata sampel.
Intersep diduga oleh b0 dan dengan b1
least squares garis regresi
diberikan oleh:
Perbedaan antara y
dan y hat disebut
residuals/ error
Garis Regresi…
…dihitung sbb:
Garis regresi penduga…
Statistics
Ingat…
Data Information
Data Points:
x y
1 6
2 1
3 9
4 5
5 17
6 12
y = .934 + 2.114x
Garis regresi penduga…
2
X Y X - Xbar Y - Ybar (X-Xbar)*(Y-Ybar) (X - Xbar)
1 6 -2.500 -2.333 5.833 6.250
2 1 -1.500 -7.333 11.000 2.250
3 9 -0.500 0.667 -0.333 0.250
4 5 0.500 -3.333 -1.667 0.250
5 17 1.500 8.667 13.000 2.250
6 12 2.500 3.667 9.167 6.250
Sum = 21 50 0.000 0.000 37.000 17.500
Xbar = 3.500
Ybar = 8.333
sxy = 7.400 37.00/(6-1)
sx 2 = 3.500 17.5/(6-1)
b1 = 2.114 7.4/3.5
b0 = 0.933 8.33 - 2.114*3.50
Excel: Data Analysis - Regression
Excel: Plot Model Regresi
20
15
Y
Y
10
Predicted Y
5
0
0 1 2 3 4 5 6 7
X Variable 1
Kondisi validitas model regresi…
Model regresi akan valid jika empat kondisi
dipenuhi:
• Sebaran peluang residual normal.
• Mean sebaran residual 0.
• Simpangan baku residual konstan terhadap
nilai variabel independen
• Residual independen terhadap nilai variabel
dependen y
Menilai model Regresi…
Metode least squares akan selalu menghasilkan
persamaan garis lurus, sekalipun tidak ada
korelasi antara dua macam variabel atau relasi
antar variabelnya nonlinear.
p-value
Sehingga:
1 no 1
Digunakan untuk estimasi suatu nilai y Digunakan untuk estimasi nilai tengah dari
(pada suatu x) y (pada suatu x)
tidak berindikasi
heteroscedastiisitas
Otokorelasi Residual
Jika data residual diurutkan menurut waktu maka
akan diperoleh data time series.
=a1-nilai average(a1:a6)
=11-nilai average(b1:b6)
Auto sum (e1:e6)
Autosum (f1:f6)
mean(X)
Lanjutan
72.5
solusi dg. excel
Mean(Y) 58.66666667 Gunakan formula slope
Sxy 1083 atau fungsi ‘slope’
Sx2 787.5
b 1.375238095 Gunakan formula intersep
a -41.03809524 atau fungsi ‘intercept’
Rsqr 0.965710334
Std Error 98.1705028
dengan