Konsumsi = 1 + 2 Pendapatan + I
Pengamatan
• 10.000 penduduk Banjarmasin , untuk melihat hubungan antara pendapatan
dan konsumsi.
120
100
Konsum si
80
60
40
20
0
0 50 100 150 200
Pendapatan
Bagaimana membentuk suatu garis yang dapat mencerminkan
kondisi umum?
Garis mana yang benar?
Konsumsi
= error/kesalahan
Pendapatan
Teknik Estimasi
Idealnya: seluruh titik berada pada garis.
Solusi?
• Standard Error
Prinsip OLS: meminimalkan error. Oleh karena itu, ketepatan dari nilai dugaan sangat
ditentukan oleh standard error dari masing-masing penduga. Adapun standard error
dirumuskan sebagai berikut:
1/ 2
2
s.e(b1 )
2
( X i X )
1/ 2
2
Xi
s.e(b0 )
N (X i X )2
Pemeriksaan Persamaan Regresi
Oleh karena merupakan penyimpangan yang terjadi dalam populasi, yang nilainya tidak
diketahui, maka biasanya diduga berdasarkan data sampel.
Adapun penduganya adalah sebagai berikut:
ε i
1/2
2
s
N 2 Berdasar formula: error yang minimal akan
mengakibatkan standar error koefisien yang minimal
pula.
Berapa batasannya standar error disebut besar atau
εi2 = (Yi Yˆi ) 2 kecil?
Pemeriksaan Persamaan Regresi
• Sulit ditentukan secara absolut.
– Data jutaan rupiah tentunya akan memiliki standar error yang lebih
besar dibanding ratusan rupiah.
• Digunakan dengan membuat rasio dengan koefisien regresi.
Bila rasio tersebut bernilai 2 atau lebih, dapat dinyatakan
bahwa nilai standar error relatif besar dibanding
Parameternya.
• Rasio inilah yang menjadi acuan pada Uji-t.
Uji Hipotesis
• Uji-F
Diperuntukkan guna melakukan uji hipotesis koefisien (slope) regresi secara bersamaan.
H0 : 2 = 3 = 4 =............= k = 0
H1 : Tidak demikian (paling tidak ada satu slop yang 0)
Dimana: k adalah banyaknya variabel bebas.
• Regresi sederhana:
H0 : 1 = 0
H1 : 1 0
• df adalah degree of freedom, k adalah jumlah variabel bebas (koefisien slope), dan n jumlah
observasi (sampel).
• Bandingkan F Hit dengan Fα(k,n-k-1)
Uji-t
• Nilai Koefisien Determinasi ini mencerminkan seberapa besar variasi dari variabel terikat Y dapat diterangkan
oleh variabel bebas X.
– Bila nilai Koefisien Determinasi sama dengan 0 (R2 = 0), artinya variasi dari Y tidak dapat diterangkan oleh X
sama sekali.
– Sementara bila R2 = 1, artinya variasi dari Y secara keseluruhan dapat diterangkan oleh X. Dengan kata lain
bila R2 = 1, maka semua titik-titik pengamatan berada tepat pada garis regresi.
– Dengan demikian baik atau buruknya suatu persamaan regresi ditentukan oleh R2-nya yang mempunyai
nilai antara nol dan satu.
Koefisien Determinasi
• R2 didefinisikan atau dirumuskan berdasarkan langkah-langkah sebagaimana
yang dilakukan pada Tabel ANOVA. Adapun rumusannya adalah:
SSR
R 2
SST
Apabila tidak ada penyimpangan tentunya tidak akan ada error.
Maka SSE = 0, yang berarti SSR = SST atau R2 = 1.
Atau dengan kata lain, semua titik-titik observasi berada
tepat di garis regresi.
Jadi, SST sesungguhnya adalah variasi dari data, sedang SSR adalah variasi
dari garis regresi yang dibuat.
Nilai Ekstrim (Outlier)
• Kenapa perlu diperhatikan?
• Regresi didasarkan pada rata-rata
sei
• Nilai berapa yang disebut ekstrim?
ei
2
s ei
sei adalah standar error estimasi atau akar dari Mean Square of Error
Interpretasi Parameter Model Regresi Linier Sederhana
Dugaan persamaan garis regresi linier sederhana
Interpretasi Parameter Model Regresi Linier Sederhana
Contoh Regresi Linier Sederhana
Pengusaha tanaman jeruk ingin mengetahui hubungan
antara nilai hasil-jual buah jeruk (Rp.) dengan luas
kebun jeruk (m2).
Hasil panen, jt rp
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Luas Kebun , m2
Model Regresi-nya:
Y = β0 + β1 X + ε
Persamaan Garis Regresi-nya : Y = β0 + β1X
Diduga dengan : Y = b0 + b1 X
Menghitung Parameter regresi
b0
b1
Model Hasil Panen:
Diagram pencar dan Garis Regresi
Hasil panen, jt rp
Kemiringan
= 0.10977
Luas Kebun , m2
Intersep
= 98.248
Dalam hal ini tidak ada kebun jeruk yang luasnya 0 m2,
jadi b0 = 98.25 hanya mengindikasikan bahwa:
untuk luas kebun yang berada dalam selang pengamatan, Rp
98.250.000 merupakan bagian dari hasil panen yang tidak
diterangkan oleh luas kebun.
Interpretasi koefisien kemiringan, b1
S2, jika
Modelnya
pas
Tabel Sidik Ragam
Analisis Ragam Regresi
Analysis of Variance
Source DF SS MS F P
Regression 1 18935 18935 11,08 0,010 Tabel Sidik Ragam
Residual Error 8 13666 1708
Total 9 32600
dimana:
= dugaan simpangan baku kemiringan garis regresi
= dugaan ragam x
Uji Statistik:
dimana:
b1 = koefisien (kemiringan) regresi
β1 = kemiringan yang dihipotesiskan
sb1 = simpangan baku kemiringan.
Uji Koefisien Regresi (b1): uji t
Apakah luas kebun mempengaruhi hasil panen buah
(secara linier)?
Analysis of Variance
Source DF SS MS F P
Regression 1 18935 18935 11,08 0,010
Residual Error 8 13666 1708
Total 9 32600 58.08% keragaman hasil panen dapat
dijelaskan oleh keragaman luas
kebun
Berbagai Kondisi yg Menggambarkan
Perbedaan antara R2 dan rXY
Berapa kira-kira hasil panen buah dari kebun jeruk yang luasnya 2000 m2 !
(data 2000 m2 bukan titik pengamatan, namun
masih berada dalam kisaran pengamatan)----------- INTERPOLASI.
Hasil panen = 98.25 + 0.1098 (Luas Kebun) = 98.25 +0.1098 (2000) = 317.85
Ketika garis regresi DIGUNAKAN sebagai alat untuk memprediksi, maka X yang boleh digunakan
adalah X yang nilainya dalam selang pengamatan.
Hasil panen, Rp
Luas kebun, m2
SELANG-KEPERCAYAAN
X
Xi
Selang Kepercayaan bagi
individu Y, untuk suatu nilai x
a
Y b X
Nilai a (intersep garis regresi), Rumus : n
Koefisien Determinasi R2
Semakin besar nilai R2, semakin baik model regresi yang diperoleh.
REGRESI LINEAR
Y Y
α α
a
a
0 1 2 X 0 1 2 X
Y = a + b X; b = tangen α
contoh garis regresi dalam bentuk grafik
Dalam grafik tampak bahwa sumbu X
berada pada kisaran angka 5 lebih
sedikit hingga angka 15 lebih sedikit.
Definisi p-value adalah tingkat signifikansi terkecil sehingga nilai suatu uji statistik yang
sedang diamati masih signifikan.
Misalnya, p-value sebesar 0.021, hal ini berarti bahwa jika H0 dianggap benar, maka kejadian yang
disebutkan di dalam H0 hanya akan terjadi sebanyak 21 kali dari 1000 kali percobaan yang sama.
Oleh karena sedemikian kecilnya peluang terjadinya kejadian yang disebutkan di dalam H0
tersebut, maka kita dapat menolak pernyataan yang ada di dalam H0 . Sebagai gantinya, kita
menerima pernyataan di dalam H1 .
Pengambilan Keputusan dengan p-value
p-value dapat diartikan sebagai besarnya peluang melakukan kesalahan apabila kita
memutuskan menolak H0.
Pada umumnya, p-value dibandingkan dengan suatu taraf signifikansi tertentu, biasanya
α = 0.05 atau 5%.
Taraf signifikansi diartikan sebagai peluang kita melakukan kesalahan untuk
menyimpulkan bahwa H0 salah, padahal sebenarnya statement H0 yang benar.
Kesalahan semacam ini disebut kesalahan Tipe I (Type one error).
Misalnya yang digunakan α = 0.05, jika p-value = 0.021 (< 0.05), maka kita berani
memutuskan menolak H0 .
Hal ini disebabkan karena jika kita memutuskan menolak H0 (menganggap statement H0
salah), kemungkinan kita melakukan kesalahan masih lebih kecil dari 0.05, dimana 0.05
merupakan ambang batas maksimal dimungkinkannya kita salah dalam membuat
keputusan.
REGRESI LINEAR
Tabel 2. Hasil panen jagung dengan dosis pemupukan urea
Rata-rata 75 5.870,75
REGRESI LINEAR
Tabel 2. Hasil panen jagung dengan dosis pemupukan urea
0 4.230 0 0 17.892.900
50 5.442 272.100 2.500 29.615.364
100 6.661 666.100 10.000 44.368.921
150 7.150 1.072.500 22.500 51.122.500
Rata-rata 75 5.870,75
REGRESI LINEAR
n XY X Y 4 x 2.010.700 300 x 23.483
b
n X X 4 x35.000 300
2 2 2
a
Y b X
23.483 19,96 x300
n 4
Y=a+bX
Jumlah Kuadrat :
JKT(Jumlah Kuadrat Total) = Y2
JK (Jumlah Kuadrat) (a) = ( Y)2
N
JK (R) (Jumlah Kuadrat Total direduksi) = JKT - JK (a)
JK (Jumlah Kuadrat) (b) = b xy
JKS (Jumlah Kuadrat Sisa) = JKR - JK (b)
JK (G) (Jumlah Kuadrat Galat) = (yk 2)
JK(TC) (Jumlah Kuadrat Tuna Cocok) = JKS - JKG
ANOVA = Analysis of Variance
Nilai-nilai hasil perhitungan tersebut kemudian dimasukan pada tabel Anova sbb :
Total .. …..
Kesimpulan : …………..
Sidik Ragam (Anova) Regresi
Uji F
F-hitung disimbulkan dengan Fhit ini diartikan bahwa dalam pengujian F akan dibuktikan
suatu hipotesis nol (H0) : Fhit = 0 dan H1: Fhit > 0
Fhitung ≈ Ftabel
(Di mana Ftabel = F(α, p,n-2) dan α = taraf nyata )
1. Jika Fhit ≤ F(tabel 5%). Hal ini berarti bahwa garis regresi penduga (Ŷ) linier sederhana
yang didapat tersebut bukan garis regresi yang terbaik untuk menghampiri pasangan
pengamatan X,Y. Atau dapat dikatakan ini berarti bahwa terdapat hubungan bukan linier
pada pasangan pengamatan X,Y tersebut.
2. Jika Fhit > F(tabel 5%). Hal ini berarti bahwa terdapat hubungan linier antara pengaruh X
terhadap Y. Atau dapat dikatakan bahwa garis regresi penduga (Ŷ) linier
sederhana yang didapat tersebut adalah garis regresi penduga yang terbaik untuk
menghampiri pasangan pengamatan X,Y.
Uji signifikansi koefisien regresi (bi)
Jika Uji-F atau uji ragam regresi menunjukkan bahwa Fhit > F(tabel 5%) barulah
dilanjutkan dengan uji koefisien regresi (Uji-t).