UNIVERSITAS ANDALAS
STATISTIKA
dan
PROBABILITAS
y y
x x
y y
x x
Contoh : Plot ‘Scatter’
(lanjutan)
Hubungan yg kuat Hubungan yg lemah
y y
x x
y y
x x
Contoh : Plot ‘Scatter’
(lanjutan)
No relationship
x
Koefisien Korelasi
Unit free
Range nilai antara -1 dan 1
Jika nilai mendekati -1, hubungan linier
variabel tersebut adalah kuat negatif
Jika nilai mendekati 1, hubungan linier
variabel tersebut adalah kuat positif
Jika nilai mendekati 0, maka hubungan linier
antara variabel lemah
Contoh : Perkiraan nilai r
y y y
x x x
r = -1 r = -.6 r=0
y y
x x
r = +.3 r = +1
Menghitung
Koefisien Korelasi
Koefisien korelasi sampel :
r
( x x)( y y)
[ ( x x ) ][ ( y y ) ]
2 2
Tinggi n xy x y
Pohon, r
y 70 [n( x 2 ) ( x) 2 ][n( y 2 ) ( y) 2 ]
60
8(3142) (73)(321)
50
40
[8(713) (73)2 ][8(14111) (321)2 ]
0.886
30
20
10
0
r = 0.886 → relatif linier positif kuat
0 2 4 6 8 10 12 14
hubungan antara x dan y
Diameter Pohon, x
Output Excel
Korelasi antara
Tinggi pohon dan Diameter pohon
Tes Signifikan untuk Korelasi
Hipotesis
H0: ρ = 0 (tdk ada korelasi)
HA: ρ ≠ 0 (terdapat korelasi)
Test statistik
r
t (df = n – 2)
1 r 2
n2
Contoh : Korelasi
Apakah terdapat hubungan linier antara
tinggi pohon dengan diameter pohon pada
tingkat nyata 0.05 ?
r .886
t 4.68
1 r 2 1 .8862
n2 82
Contoh : Solusi tes
r .886 Keputusan:
t 4.68
1 r 2 1 .8862 H0 ditolak
y β0 β1x ε
Dependen
y y β0 β1x ε
Observed Value
of y for xi
εi Kemiringan = β1
Nilai Prediksi y Kesalahan Acak
untuk xi
untuk nilai x
Potongan = β0
xi x
Perkiraan Model Regresi
Sampel garis regresi menghasilkan perkiraan garis
regresi populasi
Variabel
e 2
(y ŷ) 2
(y (b 0 b1x)) 2
Perhitungan ‘Least Squares’
b1
( x x )( y y )
(x x) 2
Atau :
x y
dan
xy
b1 n b0 y b1 x
x 2
( x ) 2
n
Interpretasi dari Kemiringan
dan Potongan
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
350 Kemiringan
300
250
= 0.10977
200
150
100
50
potongan 0
= 98.248 0 500 1000 1500 2000 2500 3000
Square Feet
Xi x
Koefisien Determinasi, R2
SSR
R 2 dimana 0 R 1
2
SST
Koefisien Determinasi, R2
(lanjutan)
Koefisien determinasi
SSR jumlah kuadrat yg dijelaskan oleh regresi
R
2
SST jumlah total kuadrat
Dimana : R r2 2
R2 = Koefisien determinasi
r = koefisien korelasi
Contoh nilai R2
y
R2 = 1
x
R2 = +1
Contoh nilai R2
y
0 < R2 < 1
x
Contoh nilai R2
R2 = 0
y
Hubungan tidak linier antara x
dan y
SSE
s
n k 1
Dimana :
SSE = jumlah kuadrat terkecil
n = jumlah sampel
k = jumlah variabel independen dalam model
Standar Deviasi
dari kemiringan Regresi
Standar ‘error ‘ dari koefisien kemiringan
regresi (b1) diestimasi dengan
sε sε
sb1
(x x) 2
( x)
x n 2
2
Dimana :
sb1 = perkiraan standar ‘error’ dari kemiringan ‘least squares’
SSE = sampel perkiraan standar ‘error’
sε
n2
Output Excel
Regression Statistics sε 41.33032
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error
Observations
41.33032
10
sb1 0.03297
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
s kecil x s b1 kecil x
y y
s besar x s b1 besar x
Kesimpulan
mengenai kemiringan : t Test
t test untuk kemiringan populasi
apakah ada hubungan linier antara x dan y?
Null dan hipotesis alternatif
H0: β1 = 0 (tdk ada hubungan linier)
H1: β1 0 (terdapat hubungan linier)
Tes statistik Dimana :
b1 β1
b1 = koefisien kemiringan
t regresi sampel
sb1 β1 = kemiringan yg
dihipotesakan
d.f. n 2
sb1 = perkiraan standar ‘error’
kemiringan
Kesimpulan
mengenai kemiringan : t Test
(lanjutan)
d.f. = 10-2 = 8
Keputusan:
/2=.025 /2=.025 H0 ditolak
Kesimpulan:
H0 Ditolak H Diterima H Ditolak
Terdapat cukup bukti
-tα/2 0 tα/2 0
0 bahwa luas mempengaruhi
-2.3060 2.3060 3.329
harga rumah
Hasil Analisa Regresi
Interval keyakinan kemiringan :
b1 t /2sb1 d.f. = n - 2
1 (xp x)
2
ŷ t /2sε
n (x x) 2
Interval Keyakinan untuk nilai
rata-rata y, untuk nilai x
1 (xp x)
2
ŷ t /2sε 1
n (x x) 2
Interval
Keyakinan
utk mean
dari y,
diketahui xp
x
x xp
Contoh: Harga Rumah