11 Regresi Dan Korelasi PDF
11 Regresi Dan Korelasi PDF
Pertemuan XII
Pemodelan
Keterkaitan
Skala pengukuran
variabel
Relationship vs Causal
Relationship
Tidak semua hubungan (relationship)
berupa hubungan sebab-akibat
Penentuan suatu hubungan bersifat
sebab-akibat memerlukan well-argued
position dari bidang ilmu terkait
Alat Analisis
Keterkaitan
Ditentukan oleh:
1. Skala pengukuran data/variabel
2. Jenis hubungan antar variabel
Causal relationship
X
Numerik Kategorik
Y
Numerik Regresi Linier ANOVA
Kategorik Regresi Logistik Regresi Logistik
• Apa itu analisis regresi?
• Apa bedanya dengan korelasi?
r=1 r=0
r=0 r=0
Korelasi
Koefisien Korelasi
tidak menggambarkan hubungan sebab
akibat
nilainya berkisar antara -1 dan 1
tanda (+) / (-) arah hubungan
– (+) searah;
– (-) beralawanan arah
Pearson’s Coef of Correlation linear
relationship
Spearman’n Coef of Correlation (rank
correlation) trend relationship
Koefisien Korelasi Pearson (r)
S xy
rxy
SxS y
S xy
( x x )( y
i i y)
1
xi yi
xi yi
n 1 n 1 n
Sx
i
( x x ) 2
dan S y
i
( y y ) 2
n 1 n 1
Korelasi !!!
Analisis Regresi
Definisi
Linear : linear dalam parameter
Sederhana : hanya satu peubah
penjelas
Berganda : lebih dari satu peubah
penjelas
linear
Hubungan
Regresi Linear parameter
non
satu linear
Peubah
penjelas
Simple Regresi non
Linear linear
>
Regression
satu
Multiple
Linear
Regression
ANALISIS REGRESI
Yi 0 1 X i i ; i 1,2,..., n
Regresi
Makna 0 & 1 ?
JK (Re gresi)
R
2
x100%
JK (Total )
b1S xy
x100%
S yy
Koefisien determinasi sebesar 80% menjelaskan bahwa
sebesar 80% keragaman dari Y dapat dijelaskan oleh
Xdalam hubungan linier, sisanya oleh faktor-faktor lain
catatan
2
2 n
n
i Y
n i X
Sxx X i2 i 1
n
Syy Yi 2 i 1 i 1 n
i 1 n
n n
n i i
X Y
Sxy X iYi i 1 i 1
i 1 n
Keterangan :
Syy = Jumlah Kuadrat Terkoreksi variabel Y
Sxx = Jumlah Kuadrat Terkoreksi variabel X
Sxy = Jumlah Kuadrat Terkoreksi variabel XY
Metoda Kuadrat Terkecil
Pendugaan parameter pada regresi didapat
dengan meminimumkan jumlah kuadrat
galat.
Keragaman yang dapat
dijelaskan dan yang tidak
dapat dijelaskan
Contoh Data
Percobaan dalam bidang lingkungan Jarak Emisi
31 553
Apakah semakin tua mobil semakin
38 590
besar juga emisi HC yang dihasilkan?
48 608
Diambil contoh 10 mobil secara acak, 52 682
kemudian dicatat jarak tempuh yang 63 752
sudah dijalani mobil (dalam ribu 67 725
kilometer) dan diukur Emisi HC-nya 75 834
(dalam ppm) 84 752
89 845
99 960
950
850
Emisi
750
650
550
30 40 50 60 70 80 90 100
Jarak
Analisis Regresi
Contoh output regresi dengan Minitab (1)
Analysis of Variance
Source DF SS MS F P
Regression 1 131932 131932 74.76 0.000
Error 8 14118 1765
Total 9 146051
Unusual Observations
Obs Jarak Emisi Fit StDev Fit Residual St Resid
8 84.0 752.0 834.7 18.0 -82.7 -2.18R
i
( y
i 1
y ) 2
i
( ˆ
y y
i 1
) 2
i i
( y ˆ
y )
i 1
2
JK (Regresi)
KT (Regresi)
db(Regresi)
JKG
KTG
db(G)
Uji Hipotesis (parsial)
H0 : 1≤0 vs H1: 1>0 atau
Satu arah
H0 : 1≥0 vs H1: 1<0 atau
H0 : 1=0 vs H1: 1≠0
dua arah
Uji Parsial
Statistik uji: T b1
Sb 1
s KTG
Sb1
( xi x ) 2
S xx
s KTG
i i
( y ˆ
y ) 2
S yy b1S xy
n2 n2
Uji Parsial (lanjutan)
Kriteria Penolakan dan Penerimaan H0 :
(tergantung H1)
Tolak Hipotesis Nol (H0) jika : thitung > t(, n-2) atau
Tolak Hipotesis Nol (H0) jika : thitung < - t(, n-2) atau
Tolak Hipotesis Nol (H0) jika : |thitung|| > t(/2, n-2)
Diskusi (1)
Berapa emisi HC yang dihasilkan jika
jarak tempuh sekitar 70 ribu km?
759,3 ppm
Berapa emisi HC yang dihasilkan jika
jarak tempuh sekitar 110 ribu km?
apakah hasil dugaan ini valid?
Kenapa? 974,9 ppm
Diskusi (2)
Berapa emisi HC yang dihasilkan jika jarak
tempuh sekitar 70 ribu km?
Tentukan selang kepercayaan 95% bagi
emisi HC jika waktu tempuhnya sekitar 70
ribu km? predictiction interval
Tentukan selang kepercayaan 95% bagi
rata-rata emisi HC jika waktu tempuhnya
sekitar 70 ribu km? confidence interval
Lebih lebar mana selang interval antara
prediction intervaldengan confidence
interval? Kenapa?
Fitted Line Plot
Emisi = 382.0 + 5.389 Jarak
1100 Regression
95% C I
1000 95% PI
S 42.0096
R-Sq 90.3%
900
R-Sq(adj) 89.1%
800
Emisi
700
600
500
400
30 40 50 60 70 80 90 100
Jarak
Diskusi (3)
Tentukan formula untuk prediction
interval dan confidence interval!
Keterbatasan Korelasi
dan Regresi Linear
Korelasi dan Regresi Linear hanya
menggambarkan hubungan yang linear
Korelasi dan metode kuadrat terkecil pada
regresi linear tidak resisten terhadap
pencilan
Prediksi di luar selang nilai X tidak
diperkenankan karena kurang akurat
Hubungan antara dua variabel bisa
dipengaruhi oleh variabel lain di luar model
‘All models are wrong,
but some are useful’
(G. E. P. Box)