Yang kita lakukan adalah memperkirakan β0 dan β1 dari data yang telah
dikumpulkan.
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.1 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.2
Peubah:
X = Peubah Bebas (Harus tersedia) Variasi
Y = Peubah Terikat (akan diperkirakan) rendah vs. tinggi
Harga
Rumah
Parameter:
β0 = YIntercept
β1 = Slope
ε ~ Peubah Acak yang mengikuti distribusi Normal (με = 25K$
0, σε = ???) [Noise] Harga rumah= 25,000 + 75(Size) +
Ukuran Rumah
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.3 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.4
Teori Model Linear 1. Membangun Model – mengumpulkan Data
Dari Data:
Estimasi β0
Estimasi β1
Estimasi σε
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.5 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.6
Height
5.8 6.2
5.4
5.8
5
4.6 5.4
100 140 180 220 260 100 140 180 220 260
Weight Weight
Plot of Height vs Weight
Plot of Height vs Weight
Plot of Fitted Model 6.8
6.6
100 6.5
6.2
Height
90 6.2
Height
Test B2
5.9 5.8
80
70 5.6 5.4
60 5.3
5
100 140 180 220 260
100 140 180 220 260
50 Weight Weight
50 60 70 80 90 100
Test B1
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.7 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.8
Analisa Korelasi… “-1 < < 1” Regresi: Model … X=ukuran rumah, Y=charga rumah
Jika koefisien korelasi dekat ke +1 artinya terdapat Model Deterministik: sebuah atau kumpulan persamaan yang
hubungan positif yang kuat antar dua peubah. memperbolehkan kita untuk memperkirakan secara keseluruhan
nilai dari peubah terikat yang dipengaruhi olehpeubah bebas.
Jika koefisien korelasi dekat ke 1 artinya terdapat hubungan
y = $25,000 + (75$/ft2)(x)
negatif yang kuat antar dua peubah.
Daerah lingkaran: A = *r2
ika koefisien korelasi dekat ke 0 artinya tidak terdapat
hubungan antar dua peubah.
Model Probabilistik: sebuah metode yang digunakan untuk
menangkap keacakan yang merupakan bagian dari proses
Pada analisa korelasi, bisa dilakukan uji hipotesia sebenarnya yang terjadi.
H0: = 0 y = 25,000 + 75x + ε
Contoh. Apakah rumah dengan ukuran yang sama akan terjual
dengan harga yang sama?
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.9 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.10
naik
lari
=slope (=naik/lari)
=y-intercept
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.11 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.12
Memperkirakan Koefisien Garis Least Squares
Dengan dasar yang sama untuk memperkirakan dengan ,
perkirakan dengan b0 dan dengan b1, yintercept dan da
be
slope dengan metode least squares atau garis regresi Beda ini disebut ku
dr at
ah
diberikan oleh: residual atau l
jum ris
error l kan n ga
a a
̂y =b 0 +b1 x im ik d
i nim ra tit
em ta
i m An
i n pt
ris rce
Ga t e
(Penggunakan metode least squares dan menghasilkan garis ini
? y-i
n
a an ntuk
lurus yang meminimilkan jumlah beda kuadrat antara titik am 4 u
ers 0.93 pe??
p
sebenarnya dengan garis regresi) a
an tkan
rim apa ntuk
slo
a
...d end 14 u
m .1
ita n 2
na k da
a
im
aga
B
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.13 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.14
Data Informasi
…dihitung sebagai berikut: Data Points:
x y
1 6
2 1
3 9
4 5
5 17
6 12
y = .934 + 2.114x
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.15 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.16
Garis Least Squares Syarat yang harus dipenuhi
Metode least square akan selalu menghasilkan garis lurus, Sum of squares for error dihitung sebagai berikut:
walaupun sebenarnya tidak ada hubungan antara kedua
peubah, atau hubungan kedua peubah bukanlah hubungan
linear (misal kuadrat, atau log).
Dan digunakan untuk menghitung estimasi standard error :
Sehingga selain melihat koefisien dari garis least square,
harus dilihat pula seberapa cocok (benar) model yang dipilih.
Untuk melihat kecocokan ini, maka harus dilihat nilai dari
sum of squares for errors (SSE).
Jika Sε maka semua titik akan berada pada garis regresi.
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.19 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.20
Standard Error… Standard Error
Untuk mengetahui apakah nilai Standard Error cukup kecil,
bandingkan dengan nilai dari mean sampel peubah terikat. (
).
Pada contoh,
= .3265 and
= 14.841
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.21 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.22
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.23 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.24
Menguji Slope Menguji Slope
Uji hipotesis untuk melihat apakah slope secara signifikan
berbeda dari “0” (dengan tingkat kepercayaan 5%) Atau dapatkan selang kepercayaan dari slope. Ingat bahwa
perkiraan adalah b1.
Yang diuji adalah:
Selang kepercayaan diberikan oleh:
H1: ≠ 0
H0: = 0
Sehingga:
Daerah penolakan adalah:
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.25 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.26
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.27 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.28
ANOVA Menggunakan Persamaan Regresi
Tabel Analysis of variance (ANOVA) untuk model regresi Persamaan regresi:
linear sederhana diberikanoleh: y = 17.250 – .0669x
Bisa digunakan untuk meramal harga mobil dengan x = 40:
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.29 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.30
Peubah error tak saling bebas Peubah error tak saling bebas
Data yang kita kumpulkan dalam bentuk tiap jam, hari, Jika terdapat pola pada grafik residu terhadap waktu, maka
minggu akan berbentuk data deret berkala (time series). terdapat autokorelasi:
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.35 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. 17.36
Pencilan (Outlier) Pencilan (Outlier)
Pencilan (outlier) adalah observasi yang biasanya terlalu Pencilan bisa terjadi karena:
kecil atau terlalu besar. • Terdapat kesalahan dalam mencatat data
• Titik tersebut seharusnya tidak ada dalam sampel
* Mungkin observasi tersebut memang tidak valid.