Handout Analisis Regresi
Handout Analisis Regresi
ANALISIS REGRESI
Kismiantini
NIP. 19790816 200112 2 001
3 4
Korelasi
Korelasi Yi = β 0 + β1 X i + ε i i = 1, 2, …, n
Sehingga :
E[Yi ] = β 0 + β1 X i
5 6
Plot Data! NEVER skip this step! The data may not
Model regresi linear sederhana even be linear and a different model may be more
appropriate.
• Model regresi diatas dikatakan sederhana, linear dalam
parameter, dan linear dalam peubah bebas.
• Dikatakan
Dik t k “sederhana”
“ d h ” karena
k h
hanya ada
d satu
t peubah
b h
bebas.
• Dikatakan “linear
linear dalam parameter
parameter” karena tidak
ada parameter yang muncul sebagai suatu eksponen atau
dikalikan atau dibagi oleh parameter lain.
• Dikatakan
Dik t k “linear
“li dalam
d l peubah
b h bebas”
b b ” karena
k
peubah dalam model tersebut berpangkat satu.
• Model yang linear dalam parameter dan linear dalam
peubah bebas juga dinamakan model ordo-pertama.
7 8
9 10
ei (sisaan
( i kke-i)
i) adalah
d l hbbeda
d antara
t nilai
il i amatan
t Yi dengan
d nilai dugaannya Yˆi
il i d
11 12
• Pendugaan
g terhadap
p koefisien regresi:
g
Bagaimana mendapatkan b0 dan b1?
Æ b0 penduga bagi β0 dan b1 penduga bagi β1
• Metode kuadrat terkecil,
terkecil yaitu dengan
meminimumkan jumlah kuadrat galat :
∑ X Y − ∑ n∑
X Y
i i
i i
b1 = Metode
( X)
∑X − ∑
n n n 2
M k dugaan
Makna d g k fi i regresi
koefisien g i Soall 1
Misalkan ingin mengetahui hubungan jarak tempuh kendaraan mobil dalam
k (X) dengan
km d ti k t emisinya
tingkat i i d l
dalam ppm (Y).
(Y) i 1 2 3 4 5 6 7 8 9 10
Xi 5,5 4,8 4,7 3,9 4,5 6,2 6,0 5,2 4,7 4,3
• Plot data ternyata menunjukkan ada hubungan linear antara X dan Y Yi 3,1 2,3 3,0 1,9 2,5 3,7 3,4 2,6 2,8 1,6
• Dicobakan model linear Yi = β0 + β1Xi + εi, diperoleh persamaan regresi
Yˆi = 364 + 5,47 X i i 11 12 13 14 15 16 17 18 19 20
• Apa makna b0 dan b1 pada konteks ini ? Xi 4,9 5,4 5,0 6,3 4,6 4,3 5,0 5,9 4,1 4,7
Makna dari b1 yaitu rata-rata emisi meningkat 5,47 ppm untuk setiap Yi 2,0 2,9 2,3 3,2 1,8 1,4 2,0 3,8 2,2 1,5
kenaikan jarak tempuh kendaraan mobil 1 km (atau kenaikan jarak
tempuh kendaraan mobil 1 km akan meningkatkan rata-rata emisi yang
dihasilkan mobil sebesar 5,47 ppm). ∑X i = 100,0; ∑ Yi = 50,0; ∑ X = 509,12; ∑ Yi = 134,84; ∑ X iYi = 257,66
i
2 2
1. Apakah nilai mutu rata-rata (NMR) pada akhir tahun pertama (Y)
Makna dari b0 yaitu untuk mobil dengan jarak tempuh kendaraan mobil 0
dapat diramalkan dari nilai ujian masuk (X)?
km (mobil baru) tingkat emisi yang dihasilkan rata-rata sebesar 364 ppm.
Bila jawaban ya, maka
2 Buatlah
2. l h diagram
d pencar X ddan Y.
3. Tentukan persamaan regresi dugaannya beserta maknanya!
15 16
Soal 2 Soal 3
• Suatu penelitian telah dilakukan untuk mengetahui hubungan
• Data berikut merupakan hasil penelitian tentang hubungan antara
antara p
pengeluaran
g untuk iklan (X dalam jjutaan rupiah)
p ) dengan
g
nilai ulangan Matematika (dalam skala nilai 10 sampai 100) dengan
penerimaan melalui penjualan (Y dalam jutaan rupiah) pada
lama waktu belajar matematika (dalam jam selama seminggu)
perusahaan tertentu. Berikut ringkasan datanya :
Nilai ulangan 95 100 100 80 70 55 50 75 55 60 65 95
matematika n = 10, ∑ X i = 120, ∑ Yi = 500, ∑ X iYi = 6106, ∑ X i2 = 1470, ∑ Yi 2 = 25440
Lama waktu 18 18 19 17 14 5 6 10 13 4 12 10
belajar matematika
a) Tentukan persamaan regresi dugaan! Berikan maknanya.
b) Bila pengeluaran untuk iklan sebesar 16 juta rupiah,
rupiah berapakah
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak penerimaan dari hasil penjualan?
bebas Y!
b) Tentukan persamaan regresi dugaan dan berikan makna dugaan
koefisien regresinya!
17 18
Soal 4
Soal 5
Seorang guru matematika mencatat lama waktu (Y, dalam Tabel ini menunjukkan
j skor tes ppenalaran verbal,, X,,
menit),
i ) yang diambil
di bil dari
d i perjalanan
j l k sekolah
ke k l h ketika
k ik dan skor tes Inggris, Y, untuk setiap sampel acak dari 8
meninggalkan rumah setelah jam 7 pagi (X, dalam menit)
anak yang mengikuti kedua tes tersebut:
pada tujuh pagi hari yang tercatat.
tercatat
Anak A B C D E F G H
X 0 10 20 30 40 50 60 X 112 113 110 113 112 114 109 113
Y 16 27 28 39 39 48 51 Y 69 65 75 70 70 75 68 76
Yi = β 0 + β1 X i + ε i
β0 dan
d β1 adalah
d l h parameter
t
Xi adalah konstanta yang diketahui nilainya
εi adalah g
galat y
yang
g menyebar
y N(0,σ
( , 2) dan bebas satu sama lain
90
0.5 80
70
Residual
cent
60
50
Perc
40
0.0 30
20
10
-0.5 5
7 1
-1 5
-1.5 -1 0
-1.0 -0 5
-0.5 00
0.0 05
0.5 10
1.0 15
1.5
8
8.0 8.5 9.0 9.5 10.0
Residual
Fitted Value
SOAL 2
| Perhatikan gambar berikut :
Scatterplot of Y vs X Versus Fits Normal Probability Plot
(response is Y) (response is Y)
90
20 99
80 95
90
70 10
80
70
60
Percent
Residual
60
Y
0 50
40
50
30
20
40
-10 10
5
30
-20 1
20 -30 -20 -10 0 10 20 30
30 35 40 45 50 55 40 50 60 70 80
Residual
X Fitted Value
Gambar 1.
1 Plot X dan Y Gambar 2.
2 Plot nilai dugaan vs sisaan Gambar 3.
3 Plot Peluang Normal
9
Selang Kepercayaan bagi β1
b1 − β1
~ t( n − 2 )
INFERENSI DALAM s{b1} Tingkat kepercayaan
⎛ b − β1 ⎞
ANALISIS REGRESI P⎜⎜ − t α ;(n − 2 ) ≤ 1 ≤ t α ;(n − 2 ) ⎟⎟ = 1 − α
⎝ 2
s{b1} 2
⎠
1. Inferensi tentang β1
b1 ± t α s{b1} dengan s 2 {b1} = KTG
a Selang Kepercayaan bagi β1
a. ;( n−
n 2) (∑ X ) 2
b. Uji bagi β1
2
∑ X i2 − n
i
2 Inferensi
2. I f i tentang
t t β0
Misalkan diperoleh selang kepercayaan 95% bagi β1
a. Selang Kepercayaan bagi β0 ,8 ≤ β1 ≤ 2,11
1,89 ,
b. Uji bagi β0 Artinya diduga bahwa rata-rata banyaknya jam-orang (Y) naik
sekitar antara 1,89 sampai 2,11 satuan untuk setiap kenaikan satu
unit
it ukuran
k llott (X)
(X).
1 2
∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
Sumber 2 2 2
db JK KT Fhit Ftabel
Keragaman i i i i
Regresi 1 JKR KTR=JKR/1 Fhit=KTR/KTG Fα(1,n-2)
Galat n-2
n2 JKG KTG=JKG/n-2
KTG JKG/n 2
JKT = JKR + JKG
JKT = ∑ Yi 2 − nY 2
Total n-1 JKT
JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi
Kriteria keputusan :
b1
X Y − ∑ i∑ i ⎥
2
⎡ Y⎤
H0 ditolak jika Fhit > Fα(1,n-2) thit = ⎤ ⎢∑ i i
X
s{b1} (∑ Yi )
⎡ 2
n
= ⎢∑ Yi 2 − ⎥− ⎣ ⎦
Kriteria keputusan : ⎢⎣ n ⎥⎦ (∑ X i )2
H0 ditolak
dit l k jika
jik |thit|>
| tα/2(n-2) ∑ i
X 2
−
n
3 4
JKR = JKT − JKG
5
6
Selang Kepercayaan bagi β0 Uji bagi β0=0 lawan β0≠0
b0 − β 0 ⎛ b − β0 ⎞
~ t( n − 2 ) P⎜⎜ − t α ;(n − 2 ) ≤ 0 ≤ t α ;(n − 2 ) ⎟⎟ = 1 − α Hipotesis
s{b0 } ⎝
2
s{b0 } 2
⎠ H0 : β0=0
⎡ ⎤ H1 : β0≠ 0
b0 ± t α s{b0 } ⎢
dengan s {b } = KTG ⎢ +
2 1 X 2 ⎥
⎥
(n − 2 ) 0
⎢n (∑ X i ) ⎥⎥
2
Taraf Nyata : α
2 ⎢
⎣
∑ i
X 2
−
n ⎦
Statistik Uji :
Misalkan diperoleh selang kepercayaan 90% bagi β0 b0
thit =
s{b0}
5,34 ≤ β0 ≤ 14,66
Artinya diduga bahwa rataan banyaknya jam jam--orang sekitar
antara 5,34 sampai 14 14,,66 satuan untuk ukuran lot sebesar 0.
Selangg ini tidak mempunyai
p y makna.
makna. Kriteria keputusan :
H0 ditolak jika |thit|> tα/2(n-2)
Selang
g kepercayaan
p y ini tidak selalu memberikan
informasi yang bermanfaat
7 8
Soal
a 1 Soal 2
Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang
memperoleh nilai di bawah 35 tidak diizinkan mengikuti kuliah
Data berikut merupakan
p hasil p
penelitian tentang
g hubungan
g antara nilai matematika yang biasa,
biasa tetapi harus mengikuti suatu kelas khusus
ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama (remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi
waktu belajar matematika (dalam jam selama seminggu). 20 mahasiswa yang mengikuti kuliah matematika yang biasa:
Nilai ulangan 95 100 100 80 70 55 50 75 55 60 65 95
matematika
L
Lama waktu
kt 18 18 19 17 14 5 6 10 13 4 12 10 a Tentukan peubah mana sebagai peubah bebas X dan peubah tak
a.
belajar matematika bebas Y!
a)Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas b. Tentukan
b u a persamaan
p a aa regresi g dugaan!
dugaa
Y! c. Bila 60 adalah nilai terendah agar lulus dari pelajaran matematika
Anggap asumsi
asumsi-asumsi
asumsi dalam model regresi linear sederhana terpenuhi. tersebut, berapakah batas nilai tes terendah di masa mendatang
untuk dapat diizinkan mengikuti kuliah tersebut?
b)Tentukan selang kepercayaan 99% bagi β0 dan β1 beserta maknanya!
Bila model regresi ordo pertama layak digunakan.
c)Ujilah
) j apakah
p ada hubungan
g linear antara lama waktu belajar
j
matematika dan nilai ulangan matematika? Gunakan taraf nyata α = 0,01. d Ujilah
d. Ujil h apakah
k h ada
d hubungan
h b linier
li i antara nilai
il i tes dan
d nilai
il i akhir?
khi ?
Gunakan taraf nyata 0,05.
d)Ujilah apakah β1 = 5 lawan β1 ≠ 5 ? Gunakan taraf nyata α = 0,01.
e Tentukan selang kepercayaan 95% bagi β0 dan β1 beserta maknanya.
e. maknanya
e)Ujilah apakah β0 = 0 atau tidak? Gunakan taraf nyata α = 0,01. 9 10
Kecepatan
p (kilometer
( per
p jam)
j ) 35 50 65 80 95 110
Jarak sampai berhenti (meter) 16 26 41 62 88 119
a)Tentukan
)T t k peubah b h mana sebagai
b i peubah b b X dan
b h bebas d peubah
b h tak
t k
bebas Y!
b)Tentukan persamaan regresi dugaan dan berikan makna dugaan
koefisien regresinya!
Anggap
gg p asumsi-asumsinya y terpenuhi.
p
c)Tentukan selang kepercayaan 95% bagi β1 dan berikan maknanya!
d)Tentukan selang kepercayaan 95% bagi β0 dan berikan maknanya! SSE = ∑ Yi 2 − 2b0 ∑ Yi − 2b1 ∑ X iYi + b0 ∑ Yi + b1 ∑ X iYi
e)Ujilah apakah ada hubungan linear antara kecepatan dan jarak
sampai berhenti? Gunakan taraf nyata α = 0,05.
f)Ujilah apakah β1 positif? Gunakan taraf nyata α = 0,05.
11 12
Normal Equation Data Kredit Konsumen
Hal 204 No. 6.5
Data di bawah ini menunjukkan bagi sebuah perusahaan kredit
konsumen yang beroperasi di enam kota, banyaknya perusahaan sejenis
yang beroperasi
b i di kota
k t itu
it (X) dan
d besarnya
b t t l kredit
total k dit dalam
d l ribuan
ib
yang tertunggak (Y):
i 1 2 3 4 5 6
Xi 4 1 2 3 3 4
Yi 16 5 10 15 13 22
Anggaplah bahwa model regresi ordo pertama layak digunakan.
a. Tentukan persamaan regresi dugaannya!
b Tentukan selang kepercayaan bagi β0 dan β1 beserta
b.
maknanya!
j
c. Ujilah apakah
p besarnya
y total kredit tertunggak
gg
13 berhubungan dengan banyaknya perusahaan sejenis yang
1
beroperasi di kota itu! 4
` Perhatikan kembali
Ukuran Deskriptif bagi Hubungan
antara Peubah
u Bebas
s ((X)) d
dan ∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
2 2 2
i i i i
Peubah Tak Bebas (Y) JKT = JKR + JKG
dalam Model Regresi ` JKT mengukur keragaman di dalam amatan-amatan Yi atau
ketidakpastian ketika meramalkan Y tanpa menggunakan peubah
bebas X ⇒ keragaman
e aga a totalo a
* Koefisien Determinasi
` JKG mengukur keragaman dalam Yi dengan menggunakan model
regresii yang menyertakan
t k peubah b b X ⇒ keragaman
b h bebas k yang
* Koefisien Korelasi tidak dapat dijelaskan
Koefisien Determinasi
P h k Gambar
Perhatikan G b 1 !!
` Ukuran untuk mengukur pengaruh X dalam menurunkan keragaman Y Jika semua amatan terletak pada garis regresi maka JKG = 0 dan r2 = 1.
adalah Peubah bebas X berhasil menjelaskan semua keragaman di dalam
JKT − JKG JKR JKG Koefisien amatan-amatan Yi.
r2 = = = 1−
JKT JKT JKT determinasi
Perhatikan Gambar 2 !!
Karena 0 ≤ JKG ≤ JKT maka 0 ≤ r2 ≤ 1 Jika kemiringan garis regresi adalah b1 = 0 sehingga
Yˆ ≡ Y maka JKG = JKT dan r2 = 0.
0
Tidak ada hubungan linear antara X dan Y.
Yˆ = b0 + b1 X Peubah bebas X dalam bentuk regresi linear tidak bisa membantu
sama sekali
k li dalam
d l menurunkan
k keragaman
k d l
dalam amatan-amatan
t t Yi.
Yˆ = Y
∑ (Y − Y )
2
kendaraan (X) dengan tingkat emisinya (Y) suatu mobil ?
⎛s ⎞
b1 = r i
= r ⎜⎜ Y ⎟⎟
∑ (X − X )
2
` Diperoleh r2= 89,9% , artinya sekitar 89,9% keragaman dari
tingkat emisi suatu mobil yang dapat dijelaskan oleh jarak i ⎝ sX ⎠
tempuhnya.
∑ (Y − Y ) ∑ (X −X)
Keragaman tingkat emisi suatu mobil berhasil diturunkan 2 2
89,9% dengan disertakan peubah jarak tempuh. sX = i
sY = i
n −1
n −1
5 6
Koefisien Korelasi Rumus Hitung bagi r
r = ± r2 ∑ (X − X )(Yi − Y )
r=
[∑ (X − X ) ∑ (Y − Y ) ]
i
2 2 12
∑ X Y − ∑ n∑
g y positif
regresinya p atau negatif.
g X Y i i
-1 ≤ r ≤ 1 i i
=
(∑ X ) ⎞⎟⎛⎜ Y − (∑ Y )
12
⎡⎛ 2 2
⎞⎤
⎢⎜ ∑ X i2 ⎟⎥
⎟⎜ ∑
− i 2 i
⎢⎜⎝ ⎟⎥
i
n n
⎣ ⎠⎝ ⎠⎦
9
10
Soal 1
Hipotesis Data nilai mutu rata-
rata-rata
1) H0: ρ = k 2) H0: ρ ≥ k 3) H0: ρ ≤ k
i 1 2 3 4 5 6 7 8 9 10
H1: ρ ≠ k H1: ρ < k H1: ρ > k
Xi 5,5 4,8 4,7 3,9 4,5 6,2 6,0 5,2 4,7 4,3
Yi 3,1 2,3 3,0 1,9 2,5 3,7 3,4 2,6 2,8 1,6
Taraf nyata : α
1+ r 1+ k
Statistik Uji : ln − ln
Z= 1− r 1− k i 11 12 13 14 15 16 17 18 19 20
1 Xi 4,9 5,4 5,0 6,3 4,6 4,3 5,0 5,9 4,1 4,7
n−3 Yi 2,0 2,9 2,3 3,2 1,8 1,4 2,0 3,8 2,2 1,5
Kriteria Keputusan :
1) H0 ditolak jika |Zhit| > Zα/2 Keterangan:
Keterangan:
Y : nilai mutu rata-rata (NMR) pada akhir tahun pertama
2)) H0 ditolak jjika Zhit < -Zα X : nilai ujian masuk
3) H0 ditolak jika Zhit > Zα Anggap model regresi linear cocok digunakan.
a) Tentukan koefisien determinasi dan maknanya
b) Tentukan koefisien korelasi
c) Apakah ρ > 0,75? Lakukan pengujian
12
hipotesis dengan α= 0,05.
11
Soal 2 Soal 3
Data Pemeliharaan Kalkulator
i 1 2 3 4 5 6 7 8 9
Data berikut merupakan hasil penelitian tentang hubungan antara nilai
Xi 7 6 5 1 5 4 7 3 4 ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama
Yi 97 86 78 10 75 62 101 39 53 waktu belajar matematika (dalam jam selama seminggu).
Nilai
a uulangan
a ga 95 100
00 100
00 80 70
0 55 50 75
5 55 60 65 95
i 10 11 12 13 14 15 16 17 18 matematika
Xi 2 8 5 2 5 7 1 4 5 Lama waktu 18 18 19 17 14 5 6 10 13 4 12 10
belajar matematika
Yi 33 118 65 25 71 105 17 49 68
a) Tentukan peubah mana sebagai peubah bebas dan peubah tak bebas!
∑Y = 1152, ∑ X i = 81, ∑ (Yi − Y ) = 16504, ∑ (X i − X ) = 74,.5, ∑ (X i − X )(Yi − Y ) = 1098
2 2
i Anggap asumsi
asumsi-asumsi
asumsi dalam model regresi linear sederhana terpenuhi.
terpenuhi
Xi adalah banyaknya kalkulator yang diservis b)Tentukan koefisien determinasi dan maknanya
Yi adalah lamanya waktu untuk memperbaiki kalkulator c)Tentukan koefisien korelasi
A
Anggap model
d l regresii linear
li sederhana
d h cocok
k digunakan.
di k
d)Ujilah apakah ada hubungan linier antara lama waktu belajar
Hitunglah koefisien determinasi
determinasi!! Berikan maknanya
maknanya!! matematika dan nilai ulangan matematika? Gunakan uji korelasi populasi
Hitunglah koefisien korelasinya
korelasinya!! dengan taraf nyata 0,05.
0 05
Apakah ρ≠ 0? Lakukan pengujian hipotesis dengan α =0,01. 13 14
Soal 4
K it i kkoefisien
Kriteria fi i kkorelasi
l i
Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang
memperoleh nilai di bawah 35 tidak diizinkan mengikuti kuliah
matematika yang biasa, tetapi harus mengikuti suatu kelas khusus (Sarwono:2006):
(remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi
20 mahasiswa yang mengikuti kuliah matematika yang biasa: – 0 : Tidak ada korelasi antara dua variabel
– >0 – 0,25: Korelasi sangat lemah
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak – >0,25 – 0,5: Korelasi cukup
bebas Y!
Bila model regresi ordo pertama layak digunakan. – >0,5 – 0,75: Korelasi kuat
b)Tentukan koefisien determinasi dan maknanya – >0,75 – 0,99: Korelasi sangat kuat
c)Tentukan koefisien korelasi
– 1: Korelasi sempurna
d)Apakah ρ = 0,85? Lakukan pengujian hipotesis dengan α= 0,01.
15 16
UJI F UNTUK KETIDAKCOCOKKAN
MODEL REGRESI LINEAR SEDERHANA
1
2
∑∑ (Y ) = ∑∑ (Y (
− Y j ) + ∑∑ Y j − Yˆij )
H1 : Model regresi linear sederhana tidak cocok 2 2
− Yˆij
2
ij ij
4
3
Statistik Uji
j Soal 1, lakukan uji kecocokan model regresi linear
J KKM (k − 2 ) sederhana gunakan taraf nyata 0,05.
sederhana, 0 05
F=
JKGM (n − k ) i Xi Yi Xi Yij ⎯Yj
1 125 160 75 28 35
JKGM = ∑∑ (Yij − Y j )
42
2 2 100 112
100 112 124
3 200 124
136
JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi
4 75 28
125 160 155
5 150 152 150
JKKM = JKG − JKGM 6 175 156 150 152 152
⎡Y1 ⎤ ⎡1 X1 ⎤ ⎡ε1 ⎤
⎢Y ⎥ ⎢1 X 2 ⎥ ⎡ β 0 ⎤ ⎢ε 2 ⎥
⎢ 2⎥ = ⎢
⎢ M ⎥ ⎢M
⎥⎢ ⎥+⎢ ⎥
M ⎥ ⎣ β1 ⎦ ⎢ M ⎥
Y = X β +ε
⎢ ⎥ ⎢ X n ⎦⎥ ⎢ ⎥ n×1 n×2 2×1 n×1
⎣Yn ⎦ ⎣1 ⎣ε n ⎦
1 2
S h
Sehingga : E{Y } = X β
n×1 n×2 2×1
Syarat : ε adalah
S d l h suatu vektor
k peubah-peubah
b h b h acakk normall
yang bebas dengan E{ε } = 0 dan σ 2 {ε } = σ 2 I
b0 ∑ X i + b1 ∑ X i2 = ∑ X iYi
ditulis dalam notasi matriks (
⇒b= X X
t
)
−1 t
X Y
⎡1 X1 ⎤ ⎡Y1 ⎤
⎡1 1 K 1 ⎤ ⎢⎢1 X 2 ⎥⎥ ⎡b0 ⎤ ⎡1 1 K 1 ⎤ ⎢⎢Y2 ⎥⎥
⎢ X X K X ⎥ ⎢M ⎢ ⎥ =⎢ ⎥
⎣ 1 2 n⎦ M ⎥ ⎣b1 ⎦ ⎣ X 1 X 2 K X n ⎦ ⎢ M ⎥
⎢ ⎥ ⎢ ⎥
⎣1 Xn⎦ ⎣Yn ⎦
3 4
Y J Y = (∑ Yi )
p : banyaknya parameter
JKR = JKT-JKG
/ ⎛1⎞ /
JKT = Y Y − ⎜ ⎟Y J Y JKG = Y Y − b X Y
/ / / ′ 2
⎝n⎠
Kriteria Keputusan :
H0 ditolak jika Fhit > Fα(p-1,n-p)
5 6
Selang Kepercayaan bagi βk Soal 1
bk ± tα / 2,(n − p )s{bk }
Suatu percobaan telah dilakukan untuk menentukan apakah berat
seekor kambing (dalam kilogram) dapat diprediksikan (setelah pada
periode tertentu) berdasarkan jumlah makanan yang dimakan (dalam
kilogram). Berikut data yang telah dinyatakan dalam notasi matriks.
′ ⎡ 10 379 ⎤ ′ ⎡ 825 ⎤ ′
⎥, X Y = ⎢31726⎥, Y Y = [70083],
′
( )
Y J Y = [680625]
⎡ s 2 {b0 } s{b0 ,b1}⎤ s 2 {b} = KTG X X
−1 X X =⎢
s {b} = ⎢
2
/ ⎣379 14533⎦ ⎣ ⎦
⎥
⎣ s{b1 , b0 } s {b1} ⎦
2
Anggap model regresi ordo pertama dapat digunakan.
a) Tentukan persamaan regresi dugaan beserta maknanya.
K fi i Determinasi
Koefisien D t i i b) Bila jumlah makanan seekor kambing sebesar 300 kg, berapakah
r2 = JKR/JKT = 1- (JKG/JKT) prediksi berat kambing tersebut?
c) Buatlah selang kepercayaan 99% bagi β1 dan berikan maknanya.
maknanya
Koefisien korelasi d) Tentukan koefisien korelasinya.
r = ± r2 7
D
Data K
Kerusakan k Rasa R
Data berikut merupakan hasil penelitian tentang hubungan antara
suhu penyimpanan (dalam °F) dan lama (dalam minggu ) sebelum
mulai terjadi kerusakan rasa suatu produk
i 1 2 3 4 5
Xi 8 4 0 -4 -8
Yi 7.8 9.0 10.2 11.0 11.7
9
Ingat!!
Ingat
Metode Kuadrat Terkecil untuk Model Regresi Linear Sederhana
n n n
Q = ∑ (Yi − E (Yi )) = ∑ (Yi − (β 0 + β1 X i )) = ∑ (Yi − β 0 − β 1 X i )
2 2 2
i =1 i =1 i =1
Dosen Pengampu : Kismiantini, M.Si. Lalu kedua turunan parsial tersebut disamadengankan nol
nol,, dengan
penduga bagi β0 dan β1 adalah b0 dan b1 yang meminimumkan Q.
n
− 2∑ (Yi − b0 − b1 X i ) = 0
n
− 2∑ X i (Yi − b0 − b1 X i ) = 0
i =1 i =1
n n n n n
∑Y
i =1
i − nb0 − b1 ∑ X i = 0
i =1
∑X Y i i − b0 ∑ X i − b1 ∑ X i2 = 0
i =1 i =1 i =1
Persamaan
Model Regresi Linear Ganda
Normal
Yi = β 0 + β1 X i1 + β 2 X i 2 + L + β p −1 X i , p −1 + ε i
n n dengan :
nb0 + b1 ∑ X i = ∑ Yi β0, β1, …, βp-1 adalah parameter
i =1 i =1
Xi1, …, Xi,p-1
,p adalah konstanta yang diketahui nilainya
n n n
εi saling bebas dan menyebar N(0,σ2)
b0 ∑ X i + b1 ∑ X i2 = ∑ X i Yi i = 1, 2, …, n
i =1 i =1 i =1
Persamaan regresi
g dugaan
g :
Yˆi = b0 + b1 X i1 + b2 X i 2 + L + b p −1 X i , p −1
3 4
5 6
⎡ 1 1 L 1 ⎤⎢
⎡1 X 11 X 12 ⎤
X 22 ⎥⎥
Memaknai Persamaan Regresi
g Dugaan
g
X X = ⎢⎢ X 11 ⎥ 1 X 21
X n1 ⎥ ⎢
'
X 21 L
⎢M M M ⎥
⎢⎣ X 12 X 22 L X n 2 ⎥⎦ ⎢ ⎥ Misalkan : Ingin mengetahui apakah volume penjualan (Y, gros)
⎣1 X n1 X n2 ⎦
b h b
berhubungan d
dengan j l h penduduk
jumlah d d k (X1, ribuan
ib ji ) dan
jiwa) d
pendapatan per kapita (X2, dolar).
⎡ n
⎢
∑X i1 ∑X i2 ⎤
⎥ Diperoleh
pe o e pe
persamaan
sa aa regresi
eg es dugaa
dugaannya ya ialah
aa
X X = ⎢ ∑ X i1 ∑X ∑X X
' 2
i1 i1 i2 ⎥ Yˆ = 3,453 + 0,496 X 1 + 0,00920 X 2
⎢∑ X i 2 ∑X X ∑X 2 ⎥
⎣ i2 i1 i2 ⎦
⎡Y ⎤
Persamaan ini menunjukkan bahwa rataan volume penjualan
⎡ 1 1 L 1 ⎤ ⎢ 1 ⎥ ⎡∑ Yi ⎤ diharapkan akan naik 0,496 gros bila jumlah penduduk naik 1 ribu
⎢ ⎥
X Y = ⎢⎢ X 11 ⎥ Y
X n1 ⎥ ⎢ 2 ⎥ = ⎢∑ X i1Yi ⎥ jjiwa kalau p
pendapatan
p per kapita
p p tetap,p, dan bahwa rataan volume
'
X 21 L
⎢M⎥ ⎢ penjualan diharapkan akan naik 0,0092 gros bila pendapatan per
⎢⎣ X 12 X 22 L X n 2 ⎦⎥ ⎢ ⎥ ⎢∑ X i 2Yi ⎥⎥
⎣Yn ⎦ ⎣ ⎦ kapita naik 1 dolar kalau jumlah penduduk tetap. Bila jumlah
penduduk sebesar 0 jiwa dan pendapatan per kapita 0 dollar maka
rata-rata volume penjualan sebesar 3,453 gros (tidak bermakna).
7 8
Standardized
H0 ditolak jika Fhit > Fα(p-1,n-p) JKG = Y ' Y − b' X ' Y
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -22.993 17.763 -1.294 .237 -64.995 19.009
Berat Awal 1 396
1.396 .583
583 .404
404 2 396
2.396 .048
048 .018
018 2 773
2.773
Jumlah Makanan .218 .058 .634 3.767 .007 .081 .354
a. Dependent Variable: Berat Akhir
9 10
Perhatikan!!!
Perhatikan !!! Uji terhadap βk s 2 {b} = KTG ( X ' X )
−1
Hipotesis :
⎛1⎞ ' H0 : βk = 0 H1 : βk ≠ 0
⎡ s {b } 2
s{b , b } L s{b0 , b p −1 }⎤
JKT = Y Y − ⎜ ⎟Y J Y
0 0 1
' ⎢
s{b , b } s {b } 2 ⎥
L s{b1 , b p −1 }⎥
s {b} = ⎢2 1 0 1
Taraf nyata : α ⎢ ⎥
⎝n⎠
M M M M
⎢ ⎥
Statistik Uji : t = bk/s{bk} ⎢⎣ s{b , b } s{b , b }
p −1 0 p −1 1 L s 2 {b p −1 } ⎥⎦
11 12
Soal 2
Makna Selang Kepercayaan Suatu p
penelitian telah dilakukan untuk mengetahui g hubungan
persentase kehadiran mahasiswa (X1) dan lama belajar dalam jam per
g antara
minggu (X2) terhadap nilai akhir ujian suatu mata kuliah (Y).
Sebanyak 30 mahasiswa telah dipilih secara acak untuk menjadi
Dari soal 1, diperoleh selang kepercayaan bagi β1 adalah subyek penelitian.
Diketahui : ⎡ 9,8866861 − 0,132528 0,640573 ⎤
0 018 ≤ β1 ≤ 2,773
0,018 2 773 (X′X )−1 = ⎢⎢− 0,132528 0,0018375 − 0,010051⎥⎥
artinya diduga bahwa rata-rata berat akhir binatang (Y) naik sekitar ⎣⎢ 0,640573 − 0,010051 0,079075 ⎥⎦
antara 0,018
, sampai
p 2,773
, kgg untuk setiapp kenaikan satu kilogram
g ∑ Yi = 2440, ∑ Yi 2 = 2016000, ∑ X i1Yi = 224670, ∑ X i 2Yi = 8880,
berat awal binatang (X1) bila jumlah makanan tetap (X2). ∑X i1 X i 2 = 9810, ∑ X i21 = 251674, ∑ X i22 = 409
13
Soal 3 Selang
g Kepercayaan
p y Serempak
p
Dari soal 1, ( X ' X )−1
8.6176001 -0.21777 -0.001093 Selang
S l k
kepercayaan b
bersama B f
Bonferronii dapat
d di
digunakan
k untukk
menduga beberapa koefisien regresi secara serempak.
-0.21777 0.0092689 -0.000552
JJika
a g bua
buah pa
parameter
a ete a akan
a ddiduga
duga seca
secaraa be
bersamaan
sa aa (asa
(asalkan
a
-0.001093
0 001093 -0.000552
0 000552 0.0000911
0 0000911 g ≤ p), maka batas-batas kepercayaan serempak dengan tingkat
kepercayaan 1-α adalah
a) Ujilah apakah ada hubungan linear antara berat akhir dengan
berat awal dan jumlah makanan? bk ± B s{bk }
b) Ujilah apakah β2=0 atau tidak?
c) Buat selang kepercayaan masing-masing bagi β1 dan β2!
B=tα
(n − p )
2g
15 16
17 18
Koefisien determinasi ganda terkoreksi Memaknai Koefisien Determinasi Ganda
Penambahan lebih banyaky ppeubah bebas ke dalam model selalu
Misalkan : Ingin mengetahui apakah volume penjualan (Y,
(Y gros)
akan menaikkan nilai R2 tidak pernah menurunkannya, sebab
berhubungan dengan jumlah penduduk (X1, ribuan jiwa) dan
JKG tidak pernah menjadi lebih besar bila peubah bebasnya
pendapatan per kapita (X2, dolar)
lebih banyak, sedangkan JKT tidak akan berubah bila data
responsnya tetap sama.
Karena R2 sering bisa dibuat besar dengan cara menyertakan Diperoleh R2 = 0,9989, artinya bila kedua bebas, jumlah penduduk
peubah bebas,
bebas maka ada yang menyarankan agar ukuran ini dan pendapatan per kapita ikut diperhitungkan maka keragaman
dimodifikasi untuk mempertimbangkan banyaknya peubah volume penjualan dapat dikurangi sebanyak 99,9%.
bebas di dalam model. atau
Koefisien determinasi ganda terkoreksi
sebesar 99,9% keragaman dari volume penjualan yang dapat
JKG (n − p ) ⎛ n − 1 ⎞ JKG dijelaskan oleh jumlah penduduk dan pendapatan per kapita.
R = 1−
2
= 1 − ⎜⎜ ⎟⎟
JKT (n − 1) ⎝ n − p ⎠ JKT
a
19 20
⇒ R= R2
Mengapa koefisien
k fi i korelasi
k l i ganda d diperoleh
di l h hanya
h
dari akar positif koefisien determinasi ganda
ganda??
21 22
Soal 4
Dari soal 1,
1 Soal 6. Data tentangg ppengiriman
g bahan kimia
a) Tentukan selang kepercayaan serempak 95% untuk β1 dan β2.
Data berikut ini, yang diambil dari 20 kali pengiriman bahan kimia
b) Hitunglah koefisien determinasi ganda dan berikan maknanya. dalam drum
drum-drum
drum di sebuah gudang, menunjukkan banyaknya drum
c) Hitunglah koefisien korelasi ganda. yang dikirimkan (X1), berat total kiriman (X2, dalam ratusan pon), dan
lamanya waktu (dalam menit) untuk menangani kiriman (Y).
Soal 5 i
Xi1
1
7
2
18
3
5
4
14
5
11
6
5
7
23
8
9
9
16
10
5
Xi2 5,11 16,72 3,20 7,03 10,98 4,04 22,07 7,03 10,62 4,76
Dari soal 2, Yi 58 152 41 93 101 38 203 78 117 44
24
Pertanyaan
a) Misalkan model regresi linear berganda cocok digunakan, tuliskan
persamaan regresi dugaannya. Bagaimana dugaan β1 dan β2
ditafsirkan dalam hal ini?
b) Ujilah
Ujil h apakah
k h ada
d hubungan
h b regresii linear
li antara
t k d
kedua peubah
b h
bebas dengan peubah tak bebas, gunakan taraf nyata 0,05.
c)) Hitunglah
g koefisien determinasi g
ganda R2! Bagaimana
g ukuran ini
ditafsirkan dalam kasus ini?
d) Ujilah β1=0 atau tidak, β2=0 atau tidak, α = 0,05.
e) Buatlah
B atlah selang kepercayaan
kepe ca aan 95% secara
seca a masing-masing nt k β1
masing masing untuk
dan β2. Berikan maknanya.
f)) Buatlah selangg kepercayaan
p y secara serempakp 95% untuk β1 dan
β2. Berikan maknanya.
25
Asumsi--asumsi dalam Regresi Linear Ganda
Asumsi
1 2
Heteroskedastisitas Normalitas
y Ragam galat diasumsikan konstan dari satu pengamatan ke y Galat diasumsikan berdistribusi Normal.
Normal ε i ~ N (0,σ 2 )
pengamatan lain, hal ini disebut homoskedastisitas. y Model regresi yang baik adalah distribusi data normal atau
y JJika ragam
g ggalat berbeda disebut heteroskedastisitas. mendekati normal.
normal
y Model regresi yang baik adalah tidak terjadi heteroskedastisitas. y Untuk mendeteksi normalitas digunakan normal p-p plot.
y Untuk mendeteksi heteroskedastisitas adalah dengan membuat
y Jika
Jik titik-titik
i ik i ik ((sisaan)
i ) menyebar
b di sekitar
ki garis
i di
diagonall ddan
plot nilai dugaan yang dibakukan (standardized predicted value)
mengikuti arah garis diagonal, maka model regresi
dengan sisaan yang dibakukan (studentized residual).
memenuhi asumsi normalitas.
normalitas
y Jika ada pola tertentu (bergelombang, melebar kemudian
menyempit) maka terjadi heteroskedastisitas. y Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan
atau tidak mengikuti arah garis diagonal
diagonal, maka model regresi
y Jika tidak ada pola jelas, serta titik-titik (sisaan) menyebar di atas
dan di bawah angka 0 pada sumbuY, maka tidak terjadi tidak memenuhi asumsi normalitas.
h t
heteroskedastisitas.
k d ti it
5 6
Autokorelasi Sifat-sifat Statistik Durbin Watson
y Bila dalam model regresi linear ganda ada korelasi antara galat
pada periode t dengan galat pada periode t-1, maka dinamakan 1. Selalu 0 ≤ d ≤ 4
aadaa masalah
asa a auto
autokorelasi.
o e as . 2
2. Jik sisaan
Jika i tterurutt bberkorelasi
k l i positif
itif ,maka
k d mendekati
d k ti noll
y Model regresi yang baik adalah model regresi yang bebas dari 3. Jika sisaan terurut berkorelasi negatif, maka d mendekati 4
autokorelasi. sehingga
hi 44-dd mendekati
d k ti 0
y Autokorelasi sering ditemukan pada regresi yang datanya 4. Distribusi d simetrik pada nilai 2
adalah time series atau berdasarkan waktu berkala seperti
bulanan, tahunan.
y Deteksi autokorelasi dengan menggunakan besaran Durbin -
n
Watson (D-W)
∑ ( e − e )2
i i −1
d= i =2
n
7 ∑e
i =1
2
i 8
9 10
11 12
Model Summaryb
Model Summaryb
Model B
Coefficients
Std. Error
Coefficients
Beta t Sig.
Collinearity Statistics
Tolerance VIF
Barat, Jawa Tengah dan Jawa Timur
1 (Constant) 161.409 24.142 6.686 .000
X1
X2
-1.225
1.225
-.649
.299
.782
-.621
.621
-.182
-4.092
4.092
-.830
.001
.417
.748
.357
1.337
2.798
y Sales (peubah tak bebas) adalah tingkat penjualan roti semua
X3
a. Dependent Variable: Y
-8.131 12.517 -.148 -.650 .524 .332 3.008
rasa (dalam unit/bulan)
y Iklan_koran
Iklan koran menyatakan iklan di koran (juta rupiah/bulan)
y Iklan_radio menyatakan iklan di radio (juta rupiah/bulan)
y Jumlah_outlet
J lh l menyatakan
k jjumlah
l h outlet
l perusahaan
h untukk
setiap daerah seperti di pasar, supermaket, mall
y Jumlah_salesman
J lh l menyatakan
k jumlah
l h salesman
l untukk setiap
daerah (orang)
15 16
Dependent Variable: Y
1.0
0.8
Expected Cum Prob
0.6
0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Observed Cum Prob
Gambar 1 Gambar 2
3 4
c) Regresi
) R i Y terhadap X d X2 : Yˆ = −19,174 + 0,2224 X 1 + 0,6594 X 2
t h d X1 dan X
Sumber JK db KT Perhatikan bahwa JKG bila X1 dan X2 dalam model ditulis sebagai
Keragaman JKG(X1, X2)=109,95 lebih kecil dari JKG bila di dalam model
Regresi JKR(X1,X2)=385,44 2 192,72 hanya ada X1 saja yaitu JKG(X1)=143,12.
Galat JKG(X1,X2)=109,95 17 6,47
Total 495,39 19 Selisih kedua jumlah kuadrat yaitu JKG(X1)-JKG(X1,X2) disebut
j l h kuadrat
jumlah k d t ekstra
k t dan
d dilambangkan
dil b k olehl h JKR(X2|X1).
)
d) Regresi Y terhadap X1 , X2 dan X3 :
Yˆ = 117,08 + 4,334 X 1 − 2,857 X 2 − 2,186 X 3 JKR(X2|X1) mencerminkan pengurangan JKG bagi X2 bila X1 sudah
ada di dalam model
Sumber JK db KT
Keragaman
Regresi JKR(X1,X2,X3)=396,98 3 132,33
JKR(X2|X1) = JKG(X1)-JKG(X1,X2)
JKR(X1|X2) = JKG(X2)-JKG(X1,X2)
Galat JKG(X1,X
X2,X
X3)=98,41
)=98 41 16 6 15
6,15
JKR(X2,X3|X1) = JKG(X1)-JKG(X1,X2,X3)
Total 495,39 19
5 6
Definisi-definisi Data Lemak Tubuh
JKR(X1|X2))=JKG(X
JKG(X2))-JKG(X
JKG(X1,X2) setara dengan
i X1 X2 X3 Y i X1 X2 X3 Y
JKR(X1|X2)=JKR(X1,X2)-JKR(X2)
1 19,5 43,1 29,1 11,9 11 31,1 56,6 30,0 25,4
2 24,7 49,8 28,2 22,8 12 30,4 56,7 28,3 27,2
JKR(X2|X1)=JKG(X1)-JKG(X1,X2) setara dengan
3 30,7 51,9 37,0 18,7 13 18,7 46,5 23,0 11,7
JKR(X2|X1)=JKR(X1,XX2)-JKR(X
) JKR(X1) 4 29,8 54,3 31,1 20,1 14 19,7 44,2 28,6 17,8
5 19,1 42,2 30,9 12,9 15 14,6 42,7 21,3 12,8
Perluasan 6 25,6 53,9 23,7 21,7 16 29,5 54,4 30,1 23,9
JKR(X3|X1,X2)=JKG(X1,X2) -JKG(X1,X2,X3) 7 31,4 58,5 27,6 27,1 17 27,7 55,3 25,7 22,6
JKR(X3|X1,X
X2)=JKR(X
) JKR(X1,X
X2,X
X3) -JKR(X
JKR(X1,X
X2) 8 27,9 52,1 30,6 25,4 18 30,2 58,6 24,6 25,4
JKR(X2,X3|X1)=JKG(X1) -JKG(X1,X2,X3) 9 22,1 49,9 23,2 21,3 19 22,7 48,2 27,1 14,8
JKR(X2,X3|X1)=JKR(X1,X2,X3) -JKR(X1) 10 25,5 53,5 24,8 19,3 20 25,2 51,0 27,5 21,1
X1 : Ketebalan Lipatan Kulit Trisep
p p X3 : Lingkar Lengan
g g
X2 : Lingkar Paha Y : Lemak Tubuh
7 8
Tabel ANOVA dengan Penguraian JKR Data Lemak Tubuh Uji Apakah Semua βk = 0
Sumber
JK db KT
Keragaman Hipotesis :
Regresi JKR(X1,X2,X3)=396,98 3 132,33 H0 : β1 = β2 = … = βpp-11 = 0
X1 JKR(X1)=352,27 1 352,27 H1 : Tidak semua βk (k=1, …, p-1) sama dengan nol
X2|X1 JKR(X2|X1)=33,17 1 33,17 Taraf nyata
y :α
X3|X1,X2 JKR(X3|X1,X2)=11,54 1 11,54
Statistik Uji :
Galat JKG(X1,X2,X3)=98,41 16 6,15
F=
( ) (
JKR X 1 , L , X p −1 JKG X 1 , L , X p −1
: =
KTR )
Total JKT=495,39 19
p −1 n− p KTG
Dari data Lemak Tubuh,
Tubuh untuk mempelajari hubungan antara Kriteria Keputusan :
banyaknya lemak tubuh (Y) dengan ketebalan lipatan kulit intersep H0 ditolak jika Fhit > Fα(p-1,n-p)
(X1), lingkar paha (X2) dan lingkar lengan (X3) yang didasarkan pada
suatu contoh 20 perempuan sehat berusia 25-34 tahun. Diperoleh
persamaan regresi dugaanya :
Yˆ = 117,08 + 4,334 X 1 − 2,857 X 2 − 2,186 X 3
9 10
Hipotesis :
Hipotesis :
H0 : βq= βq+1 = …= βp-1= 0
H 0 : β k= 0
H 1 : β k≠ 0 H1 : Tidak semua βk di dalam H0 sama dengan nol
Taraf nyata : α Taraf nyata : α
St ti tik Uji :
Statistik Statistik Uji :
( )
JKR X q , K , X p −1 X 1 , K , X q −1 JKG X 1 , K , X p −1( )
JKR(X k X 1 , L , X k −1 , X k +1 , L , X p −1 ) JKG (X 1 , L , X p −1 ) F= :
F= : p−q n− p
n− p
1
KTR (X k X 1 , L , X k −1 , X k +1 , L , X p −1 ) =
(
KTR X q , K , X p −1 X 1 , K , X q −1 )
= KTG
KTG
Kriteria Keputusan :
Kriteria Keputusan :
H0 ditolak jika Fhit > Fα(1,n-p)
H0 ditolak jika Fhit > Fα(p-q,n-p)
11 12
Dari Data Lemak Tubuh Dari Data Lemak Tubuh
Ingin diketahui apakah lingkar lengan (X3) dapat dikeluarkan dari model Ingin diketahui apakah lingkar paha (X2) dan lingkar lengan (X3) dapat
regresi penuh. dikeluarkan dari model regresi penuh.
Hipotesis Hipotesis:
H0 : β3= 0 H1 : β3≠ 0 H0 : β2= β3 =0
Taraf nyata : α = 0,050 05
JKR( X 3 X 1 , X 2 ) JKG ( X 1 , X 2 , X 3 ) H1 : Tidak benar bahwa β2 dan β3 keduanya sama dengan nol
Statistik Uji : F =
1
:
n−4 Taraf nyata : α = 0,01
=
KTR ( X 3 X 1 , X 2 ) Statistik Uji : F = JKR(X , X X ) : JKG( X , X , X )
2 3 1 1 2 3
2 n−4
KTG
KTR ( X 2 , X 3 X 1 )
Kriteria Keputusan : n = 20, p=4, F0,05(1,16)=4,49 =
KTG
H0 ditolak jika Fhit > 4,49
4 49 Kriteria Keputusan : n = 20, p=4, q=2, F0,01(2,16)=6,23
Hitungan :
H0 ditolak jika Fhit > 6,23
F=(11,54/1)/(98,41/16)=1,876
( , / )/( , / ) , Hitungan :
Kesimpulan :
F=(44,71/2)/(98,41/16)=3,63
Karena Fhit=1,876<4,49 maka H0 diterima, artinya dengan taraf Kesimpulan :
nyata 00,05
05 dapat disimpulkan bahwa lingkar lengan dapat Karena Fhit=3,63<6,23 maka H0 diterima, artinya dengan taraf nyata
dikeluarkan dari model regresi. 0,01 dapat disimpulkan bahwa lingkar paha dan lingkar lengan dapat
dikeluarkan dari model regresi yang di dalamnya terdapat ketebalan
lipatan kulit trisep (X1).
13 14
Sum of
Model Squares df Mean Square F Sig.
1 Regression 1872.700 2 936.350 129.083 .000a
Residual 94.300 13 7.254
Total 1967.000 15
a. Predictors: (Constant), X2, X1
hubungan antara derajat kesukaan terhadap merek
1 4 2 64 Coefficientsa
(Y) dengan kandungan uap air (X1) dan kemanisan Unstandardized Standardized
2 4 4 73 produk (X2). Hasil sebagai berikut : Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
3 4 2 61 1 (Constant) 37.650 2.996 12.566 .000 31.177 44.123
i Xi1 Xi2 Yi a) Tentukan persamaan X1 4.425 .301 .892 14.695 .000 3.774 5.076
4 4 4 76 regresi dugaan!
9 8 2 83
X2 4.375 .673 .395 6.498 .000 2.920 5.830
5 6 2 72 β1=β
b)) Ujilah apakah β
j p β2=0 a. Dependent Variable: Y
10 8 4 89 atau tidak?
6 6 4 80 Coefficient Correlationsa
11 8 2 86 c) Buatlah tabel ANOVA Model X2 X1
7 6 2 71 penguraian JKE untuk 1 Correlations X2 1 000
1.000 .000
000
12 8 4 93 kedua peubah bebas! X1 .000 1.000
8 6 4 83
13 10 2 88
Covariances X2 .453 .000
d) Ujilah apakah β2 = 0 X1 .000 .091
atau tidak?
14 10 4 95 a. Dependent Variable: Y
Model Summary
18
Lanjutan Koefisien Determinasi Parsial Data Lemak Tubuh
JKR( X 1 X 2 ) JKR( X 2 X 1 , X 3 ) JKR( X 2 X 1 ) 33,17
rY21.2 = rY22.13 = rY22.1 = = = 0,232
JKG ( X 2 ) JKG ( X 1 , X 3 ) JKG ( X 1 ) 143,12
Artinya : Jika X2 dimasukkan ke dalam model regresi yang di dalamnya
JKR( X 1 X 2 , X 3 ) JKR( X 4 X 1 , X 2 , X 3 )
sudah ada X1 maka JKG akan berkurang 23,2%.
rY21.23 = rY24.123 =
JKG ( X 2 , X 3 ) JKG ( X 1 , X 2 , X 3 ) JKR( X 3 X 1 , X 2 )
11,54
rY23.12 = = = 0,105
JKG ( X 1 , X 2 ) 109,95
A ti
Artinya : Jik
Jika X3 dimasukkan
di kk kke ddalam
l model
d l regresii yang di d
dalamnya
l
JKR( X 3 X 1 , X 2 )
sudah ada X1 dan X2 maka JKG akan berkurang 10,5%.
rY23.12 =
JKG ( X 1 , X 2 ) JKR( X 1 X 2 )
3,47
rY21.2 = = = 0,031
JKG ( X 2 ) 113,42
Artinya : Jika X1 dimasukkan ke dalam model regresi yang di dalamnya
sudah ada X2 maka JKG akan berkurang g 3,1%.
,
19 20
21 22
Soal 2 Soal 3
Telah diambil secara acak 25 mahasiswa untuk suatu penelitian tentang Seorang guru ingin mengetahui
S h hubungan
h b antara skor
k matematika k siswa
tingkat kecerdasan IQ (X1), nilai ujian tengah semester (X2), nilai ujian (Y) dengan skor logika siswa (X1) dan skor verbal siswa (X2), yang diukur
akhir
khi semester
t (X3) terhadap
t h d nilai
il i hasil
h il akhir
khi suatu
t matat kuliah
k li h (Y).
(Y) dalam skala 1
1-10
10. Untuk keperluan tersebut,
tersebut telah dipilih secara acak 20
Berikut beberapa output yang diperoleh : siswa dari suatu sekolah menengah pertama negeri. Beberapa output
berdasarkan data yang diperoleh sebagai berikut:
Hipotesis
H0 : E{Y} = β0+ β1X1+ β2X2 + …+ βp-1Xp-1 JKG = JKGM + JKKM
H1 : E{Y} ≠ β0+ β1X1 + β2X2 + …+ βp-1Xp-1
Perhatikan :
Atau
H0 : Tidak ada ketidakcocokan model regresi linear ganda dengan Yij − Yˆij = Yij − Y j + Y j − Yˆij
data
H1 : Ada ketidakcocokan model regresi linear ganda dengan data
Simpangan Simpangan Simpangan
Atau ketidakcocokan
galat
g g
galat murni
H0 : Model
M d l regresii linear
li ganda
d cocokk model
d l
H1 : Model regresi linear ganda tidak cocok
∑∑ (Y ) = ∑∑ (Y (
− Y j ) + ∑∑ Y j − Yˆij )
2 2 2
ij − Yˆij ij
3 4
KTKM JKKM (k − p )
Xi1 4 4 4 4 6 6 6 6 8 8 8 8 10 10 10 10
JKGM = ∑∑ (Yij − Y j )
2
F= = Xi2 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4
KTGM JKGM (n − k ) Yi 64 73 61 76 72 80 71 83 83 89 86 93 88 95 94 100
JKG = Y ' Y − b' X ' Y Xi1 Xi2 Yij ⎯Y
Yj Y : derajat
d j t kkesukaan
k tterhadap
h d merk
k
JKKM = JKG − JKGM 4
4
2
4
64; 61
73; 76
X1 : kandungan uap air
X2 : kemanisan produk
db(G) = n − p; db(GM) = n − k; db(KM) = k − p 6 2 72; 71
k = 8,
8 JKG = 94,3
94 3
J
JKKM=JKG-JKGM=
J J
F=(/5)/(/)=
Kesimpulan : Karena Fhit= …………………..
Jadi dengan taraf nyata 0
0,05
05 dapat disimpulkan bahwa model
regresi linear ……………...
7
Perhatikan gambar berikut
β2 < 0 β2 > 0
Regresi Kuadratik
Regresi kuadratik termasuk dalam regresi non linear yang
menyatakan hubungan antara dua peubah yang terdiri Model Regresi Polinomial Kuadratik
dari peubah tak bebas (Y) dan peubah bebas (X) sehingga
akan diperoleh suatu kurva yang membentuk garis
( )
iid
lengkung menaik (β2 > 0) atau menurun (β2 < 0). Bentuk
persamaan matematis model kuadratik secara umum
p Y = β 0 + β1 X + β 2 X 2 + ε , ε ~ N 0, σ 2
menurut Steel & Torrie (1980) adalah :
a. Polinomial : E(Y) = β0+β1X+β2X2
b. Eksponensial : E(Y) = β0β1X P
Persamaan regresii dugaannya
d
c. Logaritma
g : Log ( )=β
g E(Y) β’0β
β’1X
Yˆ = b0 + b1 X + b2 X 2
( )
= b0' − b1' X + b2' X 2 + b1' − 2b2' X X + b2' X 2 Karena ∑x
i =0
maka
k persamaan
normalnya menjadi sbb :
Sehingga :
nb0' + b2' ∑ xi2 = ∑ Yi
b0 = b0' − b1' X + b2' X 2
b1 = b1' − 2b2' X b1' ∑ xi2 + b2' ∑ xi3 = ∑ xiYi
b2 = b2' b0' ∑ xi2 + b1' ∑ xi3 + b2' ∑ xi4 = ∑ xi2Yi
5 6
Data Volume Penjualan Kopi di Kafetaria
Kafetaria Banyaknya Volume Penjualan
(i) Dispenser (Xi) (ratusan galon) Yi
a. Tentukan koefisien
1 0 508 1
508,1 k l i antara
korelasi t X
2 0 498,4 dengan X2.
3 1 568,2 b. Lakukan transformasi
4 1 577,3 x=X−X
5 2 651,7 c. Hitunglah koefisien
6 2 657,0 korelasi antara x
dengan x2.
7 3 ,
713,4 d Apa yang dapat
d.
8 3 697,5 disimpulkan dari hasil a
9 4 755,3
, dan c?
e. Tentukan
T t k persamaan
10 4 758,9 regresi polinomial
11 5 787,6 kuadratik dugaan.
12 5 792,1
13 6 841,4
14 6 831,8
Jawab : Uji
j Apakah
p β2 Sama dengan
g Nol
(Menyelidiki apakah suku kuadratik dapat dibuang dari model)
Xi Yi xi Xi^2 xi^2 Correlations: X, X2
0 508.1
508 1 -3
3 0 9
Pearson correlation of X and X2 = 0,961
Hipotesis :
0 498.4 -3 0 9 P-Value = 0,000 H0 : β 2 = 0
1 568.2 -2 1 4
1 577.3 -2 1 4 Correlations: x, x2 H1 : β 2 ≠ 0
2 651.7 -1 4 1 Taraf Nyata : α
Pearson correlation of x and x2 = 0,000
2 657 -1
1 4 1 P-Value = 1,000 St ti tik Uji : t = b2/s{b
Statistik / {b2}
3 713.4 0 9 0
Kriteria Keputusan : H0 ditolak jika |thit| > tα/2(n-p)
3 697.5 0 9 0 Scatterplot of Y vs X
850
4 755.3 1 16 1 800
4 758.9 1 16 1 750
5 787 6
787.6 2 25 4 700
St ti tik Uji : F = (JKR(
Statistik (JKR(x2|x)/1)/(JKG(x,x
| )/1)/(JKG( 2)/(n-p))
)/( ))
Y
5 792.1 2 25 4 650
600 = KTR(x2|x)/KTG(x,x2)
6 841.4 3 36 9 550
Kriteria Keputusan : H0 ditolak jika Fhit > Fα (1,n-p)
6 831.8 3 36 9 500
0 1 2 3 4 5 6
( )
X
The regression equation is The regression equation is JKG x, x 2 = ∑ Yi 2 − b0′ ∑Yi − b1′ ∑ xi Yi − b2′ ∑ xi2Yi
Ŷ = 705,5 + 54,89 x – 4,249 x2 Ŷ = 502,6 + 80,39 X – 4,249 X2
9 10
700
⎢ ⎥
s {b} = ⎢ s{b1 , b0 } s 2 {b1 } s{b1 , b2 }⎥
Y
2 650
600
' xi H0 ditolak
d l k jika
k Fhit > 4,84 (thit)2 = (-7,012)2 = 49,2 = Fhit
11 12
Koefisien Determinasi Ganda Uji Kecocokan Model Regresi Polinomial Kuadratik
Hipotesis
H0 : E{Y} = β0+β1x+β2x2 (model regresi polinomial kuadratik cocok digunakan)
R2 = JKR(x,x2)/JKT = 171773/172453 = 0,996 H1 : E{Y} ≠ β0+ β1x+β2x2 (model
( d l regresii polinomial
li i lkkuadratik
d ik tidak
id k cocok
k di
digunakan)
k )
Artinya keragaman volume penjualan kopi bisa diturunkan
Taraf nyata : α ⎛ ni 2⎞
JKGM = ∑ ⎜⎜ ∑ (Yij − Y j ) ⎟⎟
p 99,6%
sampai , bila hubungan
g polinomial kuadratik terhadap
p p k
banyaknya mesin dispenser dimasukkan ke dalam model. Statistik Uji: JKKM /(k − p )
F= j =1 ⎝ i =1
JKGM /( n − k ) ⎠
( )
JKG x, x 2 = ∑ Yi 2 − b0′ ∑Yi − b1′ ∑ xi Yi − b2′ ∑ xi2Yi
13 14
Soal 1 Soal 2
Data Studi Efisiensi Bahan Bakar
Suatu penelitian ingin menyelidiki apakah ada hubungan kuadratik
Keefektifan suatu persneling baru dalam menurunkan konsumsi
antara berat larva (X) dengan banyaknya oksigen yang dikonsumsi
b h bakar.
bahan b k
(Y). Data yang diperoleh sebagai berikut:
Xi : kecepatan konstan (dalam km per jam)
Yi : km per liter yang diperoleh
X Y X Y X Y X Y
i 1 2 3 4 5 6 7 8 9 10 11 12
0,519 0,610 0,114 0,477 0,033 0,744 0,140 0,855
Xi 35 35 40 40 45 45 50 50 55 55 60 60
Yi 22 20 28 31 37 38 41 39 34 37 27 30 0,053 0,482 0,137 0,551 0,049 0,711 0,204 0,932
0 190
0,190 0 516
0,516 0 230
0,230 0 588
0,588 0 210
0,210 0 927
0,927 0 265
0,265 0 914
0,914
a. Buatlah diagram pencar antara X dan Y! Apa yang diketahui
dari diagram tsb? 0,210 0,561 0,240 0,561 0,215 0,914 0,346 0,973
b. Tentukan koefisien korelasi antara X dengan X2. 0,260 0,580 0,470 0,718 0,462 1,000 0,544 0,800
c. Bila diperlukan, lakukan transformasi terhadap X.
d Apakah model regresi kuadratik cocok digunakan?
d. 0,389 0,674 0,521 0,754 0,468 0,998 0,004 0,654
Gunakan α = 0,05
a. Buatlah tabel Anava untuk regresi polinomial kuadratik
b Tentukan
b. T t k persamaan regresii polinomial
li i l kuadratik
k d tik d dugaan
c. Apakah model regresi polinomial kuadratik cocok digunakan?
15
Soal 3 Soal 4
Untuk mengetahui hubungan antara pengeluaran untuk promosi (X, Suatu penelitian telah dilakukan untuk mengetahui hubungan
dalam ribuan dolar) dan permintaan akan produk perusahaan (Y, (Y antara tentang tes kemampuan bahasa (X) dan nilai karya
dalam ribuan dolar) di suatu daerah telah dilakukan penelitian dan ilmiah (Y) dari 10 siswa kelas I SMA. Diduga bahwa model
p
diperoleh data sbb : regresi polinomial kuadratik cocok digunakan.
Diketahui:
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14
⎡ 0,1813176 − 0,006212 − 0,002259⎤
Xi 17 15 25 10 18 15 20 25 17 13 20 23 25 16
(x′x )−1 = ⎢⎢− 0,006212 0,0032523 0,0001725 ⎥⎥
Yi 56, 54, 55, 52, 56, 55, 55, 54, 55, 54, 55, 55, 54, 55,
15 50 27 54 23 97 55 32 14 28 78 65 96 06 ⎢⎣− 0,002259 0,0001725 0,0000627 ⎥⎦
∑Y i = 458, ∑ Yi 2 = 21604, ∑ xiYi = 304, ∑ xi2Yi = 17252 , ∑ xi2 = 360, ∑ xi4 = 31620
a. Gambarkan diagram pencarnya
pencarnya!!
b. Tentukan persamaan regresi kuadratik dugaan!
dugaan! a) Tentukan persamaan regresi polinomial kuadratik dugaan.
c. Ujilah ketidakcocokan model regresi kuadratik!
kuadratik!
b) Tentukan koefisien determinasi ganda dan berikan
Gunakan α = 0,05
maknanya.
c) Apakah suku kuadratik dapat dibuang dari model? Gunakan
α = 0,05.
0 05
17
MODEL REGRESI POLINOMIAL ORDE KEDUA
Y = β 0 + β1 x1 + β 2 x 2 + β11 x12 + β 22 x 22 + β 12 x1 x 2 + ε
ε ~ N (0, σ 2 )
iid
1 Apakah model regresi polinomial
orde kedua cocok digunakan?
X 1 − X 1 X 1 − 1,0 X 2 − X 2 X 2 − 20
x1 = = x2 = = UJI KECOCOKAN
CONTOH 0,4 0,4 10 10
MODEL REGRESI POLINOMIAL ORDE KEDUA
i X1 X2 x1 x2 Y Yj Hi t i
Hipotesis
H0 : E{Y} = β0+β1x1+β2x2+β11x12+β22x22+β12x1x2(model regresi
1 0,6 10 -1 -1 150 150
polinomial orde kedua cocok digunakan)
2 1,0 10 0 -1 86 86
H1 : E{Y} ≠ β0+β1x1+β2x2+β11x12+β22x22+β12x1x2 (model regresi
3 1,4 10 1 -1 49 49
polinomial orde kedua tidak cocok digunakan)
4 0,6 20 -1 0 288 288
Taraf nyata : α
5 1,0 20 0 0 157
6 1,0 20 0 0 131 157,33 Statistik Uji:
7 1,0 20 0 0 184 JKKM /(k − p ) ⎛ ni 2⎞
JKGM = ∑ ⎜⎜ ∑ (Yij − Y j ) ⎟⎟
k
F=
8 1,4 20 1 0 109 109 JKGM /(n − k ) j =1 ⎝ i =1 ⎠
9 06
0,6 30 -1
1 1 279 279
10 1,0 30 0 1 235 235
11 1,4 30 1 1 224 224 JKKM = JKG − JKGM
X 1 = 1,0 X 2 = 20 Kriteria keputusan : k = banyaknya x yang berbeda,
p = banyaknya parameter
3 H0 ditolak jika Fhit
h > Fα(k-p,
(k n-k)
k) 4
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 55365.561 5 11073.112 10.565 .011a
Residual 5240.439 5 1048.088
Total 60606.000 10
a. Predictors: (Constant), x1x2, x2kuadrat, x2, x1, x1kuadrat
b. Dependent Variable: Y
JKGM=(157-157,33)2+(131-157,33)2+(184-157,33)2=1404,676
JKKM=JKG-JKGM=5240-1404,67=3835,33
db1 = k-p = 9-6 = 3
db2 = n-k = 11-9 = 2
ANOVAb F0,05(3,2)=19,2,
19 2 H0 ditolak
dit l k jika
jik Fhit > 19,2
19 2
Sum of Fhit=(3835,33/3)/(1404,675/2)=1,82
Model Squares df Mean Square F Sig.
1 Regression 55365 561
55365.561 5 11073 112
11073.112 10 565
10.565 011a
.011 Karena Fhit=1
1,82<19,2
82<19 2 maka H0 diterima.
diterima
Residual 5240.439 5 1048.088
Jadi dengan taraf nyata 0,05 dapat disimpulkan bahwa
Total 60606.000 10
a. Predictors: (Constant), x1x2, x2kuadrat, x2, x1, x1kuadrat
model regresi polinomial orde kedua cocok digunakan.
5 6
b. Dependent Variable: Y
SOAL
| Dalam suatu studi percobaan skala kecil tentang
hubungan antara derajat kesukaan terhadap merek (Y)
dengan kandungan uap air (X1) dan kemanisan produk
(X2). Hasil sebagai berikut :
| Hipotesis:
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 H0 : β12 = 0
Xi1 4 4 4 4 6 6 6 6 8 8 8 8 10 10 10 10
Xi2 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 H1: β12 ≠ 0
Yi 64 73 61 76 72 80 71 83 83 89 86 93 88 95 94 100 | Taraf nyata: α
| Hipotesis:
H0 : β22 = 0
H1: β22 ≠ 0 | Hipotesis:
| Taraf nyata: α H0 : β11 = β22 = β12 = 0
| Statistik Uji:
F=
(
JKR x22 x1 , x2 , x12 1 ) H1 : tidak semua βk (k = 11, 22, 12) dalam H0
(
JKG x1 , x2 , x12 , x22 ) (n − p ) sama dengan nol
| Kriteria Keputusan Taraf nyata : α
H0 ditolak jika Fhit > Fα(1, n-p) Statistik Uji : JKR (x12 , x22 , x1 x2 x1 , x2 ) 3
F=
(
JKG x1 , x2 , x12 , x22 , x1 x2 ) (n − p )
Y = β 0 + β1 x1 + β 2 x2 + β11 x12 + ε
9
Kriteria Keputusan 10
Bagaimana untuk uji β11 = 0 atau tidak?
H0 ditolak jika Fhit > Fα(3, n-p)
11
Latar Belakang
• Ingin membandingkan prestasi belajar murid
perempuan dan laki-laki
DUMMY VARIABLE • Ingin meneliti bagaimana pengaruh jenis makanan
((Peubah Boneka)) terhadap berat ayam
y
• Jenis kelamin dan jenis makanan merupakan
Dosen Pengampu : Kismiantini
Kismiantini,, M.Si
M.Si.. peubah yang sifatnya klasifikasi
• Semua peubah dalam regresi bersifat kuantitatif
maka peubah kualitatif dijadikan kuantitatif agar
regresi dapat digunakan
1 2
Sehingga misalkan ada 30 murid yang terbagi dalam tiga Soal 1: Suatu penelitian telah dilakukan untuk mengetahui adanya
p
perbedaan penggajian
p gg j ((diskriminasi)) terhadap
p karyawan
y wanita dan p
pria di
kelompok tiap kelompok terdiri atas 10 murid
kelompok, murid. Maka nilai X1
suatu perusahaan. Karyawan yang diteliti adalah yang memiliki tingkat
dan X2 yang mungkin terbentuk sebagai berikut pendidikan yang sama.
Kelompok
p i X1 X2
Pria Wanita
1 0 0 Gaji (dalam ratusan Lama Bekerja Gaji (dalam ratusan Lama Bekerja
2 0 0 i i
ribu per minggu) (tahun) ribu per minggu) (tahun)
. . .
I 1 28 1 12 20 1
. . .
. . . 2 28 2 13 24 3
10 0 0 3 28 4 14 21 4
11 1 0 4 21 6 15 28 6
12 1 0 5 28 6 16 23 9
II
. . . 6 29 8 17 25 11
. . . 7 33 15 18 23 17
. . . 8 36 20 19 21 19
20 1 0
9 39 25 20 25 23
21 0 1 10 39 24 21 26 28
22 0 1 11 43 30
. . .
III
. . . a. Tentukan p
persamaan regresi
g dugaan
g yang
y g sesuai untuk p
permasalahan tsb.
. . .
b. Buat gambar garis regresi untuk masing-masing jenis kelamin karyawan. Apa
30 0 1 9 10
yang dapat disimpulkan.
Yan, X. & Su, X.G. 2009.Linear regression analysis : theory and computing.
New Jersey: World Scientific Publishing.
Publishing
13
REGRESI NON LINEAR
2
1
3 3
4
Model Eksponensial Yˆ = b0 b1
X Model Geometrik (Power)
Yˆ = b0 X b1
Persamaan regresi dugaan : Persamaan regresi dugaan :
ln Yˆ = ln b0 + (ln b1 )X ln Yˆ = ln b0 + b1 ln X
Mencari b0 dan b1 : Mencari b0 dan b1 :
n(∑ X i ln Yi ) − (∑ X i )(∑ ln Yi ) n(∑ ln X i ln Yi ) − (∑ ln X i )(∑ ln Yi )
l b0 =
∑ ln Y − (ln
l b)
∑X ln b1 = ln b0 =
∑ ln Y i
− b1
∑ ln X i b1 =
n∑ X i2 − (∑ X i ) n∑ ln 2 X i − (∑ ln X i )
i i
ln 1
2 2
n n n n
Data : Data
Yˆ = (377,495) X −0,286
Yˆ = (11,240)(e 0,159 ) X
5 6
1
Yˆ = 1
Model Logistik b0 b1
X
Model Hiperbola Yˆ =
b0 + b1 X
Persamaan regresi dugaan : ⎛1⎞ Persamaan regresi dugaan :
ln⎜ ⎟ = ln b0 + (ln b1 )X 1
= b0 + b1 X , jika Yˆ ≠ 0
Mencari b0 dan b1 : ⎝ Yˆ ⎠ Mencari b0 dan b1 : Yˆ
ln(1 Y )
∑ i − (ln b ) ∑ i lnl b = ∑ X i ln(1 Yi )) − (∑ X i )(∑ ln(1 Yi ))
X n( ∑ (1 Yi )(∑ X i2 ) − (∑ X i )(∑ X i Yi )
ln b0 = b0 = n(∑ X i Yi ) − (∑ X i )∑ (1 Yi )
n∑ X i − (∑ X i ) n∑ X i2 − (∑ X i )
1 1 2 2
n n 2
b1 =
n∑ X i2 − (∑ X i )
2
Data : Data :
160
140
120
100
Y
Y
80
Yduga
60
40
20
1 0
Yˆ = Yˆ =
1 0 500 1000 1500 2000
7 8
Soal 1 Soal 2
Suatu perusahaan yang mengalami kemunduran ditunjukkan oleh X : harga barang per unit dalam ribuan rupiah
merosotnya hasil
h il penjualan
j l dari
d i tahun
h kek tahun
h sebagai
b i berikut:
b ik Y : hasil penjualan barang tersebut dalam jutaan rupiah
T h
Tahun 2001 2002 2003 2004 2005 2006 2007 X 20 35 60 100 150 300 500 800
Hasil Penjualan 83 60 54 21 22 13 13
(dalam jutaan
rupiah)
Dengan menggunakan model eksponensial, berapa prediksi hasil
Dengan menggunakan
D k model
d l kuadratik,
k d tik tentukan
t t k b
berapa prediksi
dik i penjualan
j l kalau
k l X = 900? Gambarkan
G b k grafik fik Y dan
d Ŷ dalam
d l satu
t
hasil penjualan untuk tahun 2008 dan 2009? Gambarkan grafik Y gambar.
dan Ŷ dalam satu gambar.
9 10
Soal 3 Soal 4
X = kecepatan (dalam km) ketika rem mulai diinjak
Perkembangan industri rumah tangga dari suatu daerah selama 6
Y = jarak (dalam m) yang masih ditempuh mobil dihitung mulai
tahun,
h adalah
d l h sebagai
b i berikut:
b ik
rem diinjak hingga berhenti.
Pemeriksaan jarak berhenti sejak mobil direm pada tiap kecepatan
tidak dilakukan hanya sekali melainkan berulang-ulang
berulang ulang atau
Tahun 2002 2003 2004 2005 2006 2007
terhadap beberapa mobil. Hasilnya seperti berikut:
Kode Tahun 2 3 4 5 6 7
X 10 20 30 40 50 60 70 80 Banyaknya industri 4 8 12 18 18 20
Y 9,2 16,4 27,3 41,8 62,4 88,5 120,0 141,8 Dengan menggunakan model logistik, berapa prediksi banyaknya
8,7
, 15,2
, 28,2
, 40,2
, 63,1
, 86,2
, 119,1
, 140,1
,
industri rumah tangga pada tahun 2010.
2010 Gambarkan grafik Y dan Ŷ
9,0 16,7 26,8 60,9 120,4 138,9
8,9 27,0
dalam satu gambar.
13 14
Latar Belakang
• Regresi logistik adalah bagian dari analisis regresi yang
di
digunakan
k k ik peubah
ketika b h dependen
d d (
(respons)
) merupakan
k
peubah dikotomi. Peubah dikotomi biasanya hanya terdiri atas
REGRESI LOGISTIK
REGRESI LOGISTIK dua nilai,
nilai yang mewakili kemunculan atau tidak adanya suatu
kejadian yang biasanya diberi angka 0 atau 1.
1 2
Yi Peluang
1 P(Yi = 1) πi
1) = π
0 P(Yi = 0) = 1‐ πi
dengan πi menyatakan
d k peluang
l b h Yi = 1, dan
bahwa 1 d 1‐π1 i menyatakan
k
peluang bahwa Yi = 0.
3 4
Model Regresi
Model Regresi Logistik Sederhana • Karena pengamatan Yi saling bebas, maka fungsi peluang bersama
adalah
d l h
• Model regresi logistik sederhana: Yi = E(Yi) + εi , dengan Yi
mer pakan peubah
merupakan pe bah acak Bernoulli dengan
Berno lli dengan E(ε
E( i ) = 0.
) 0
exp(β 0 + β1 X i ) • Untuk mempermudah estimasi parameter dengan metode
E (Yi ) = π i =
1 + exp(β 0 + β1 X i )
maksimum likelihood maka
• Peubah X diasumsikan konstanta yang diketahui.
• Yi i merupakan peubah acak Bernoulli dengan
Bernoulli dengan fungsi peluang
5 6
• Sehingga fungsi likelihood adalah sebagai berikut Data Tugas Pemrograman (Hal 566)
• Peubah bebas adalah pengalaman pemrograman dalam bulan.
Peubah tak bebas (peubah respons) adalah kesuksesan program,
dengan 1 = sukses, 0 = gagal.
• Selanjutnya diturunkan terhadap masing‐masing parameter dan • Dengan estimasi maksimum likelihood diperoleh
dimaksimumkan Sehingga diperoleh penduga bagi β0 yaitu b0 dan
dimaksimumkan. Sehingga
penduga bagi β1 yaitu b1. Fungsi respons logistik dugaan
g respons
• Fungsi p logistik
g dugaan
g adalah exp(− 3,0597 + 0,1615 X )
πˆ =
1 + exp(− 3,0597 + 0,1615 X )
Rasio Odds (Odds Ratio
Odds (Odds Ratio))
OR = exp(0,1615) = 1,175
• Peluang menyelesaikan tugas naik sebesar 17,5%
17 5% = (117,5‐100)%
(117 5‐100)%
untuk setiap kenaikan 1 bulan pengalaman pemrograman.
9 10
Soal (Data kemampuan
(Data kemampuan bekerja
bekerja)
)
Regresi Logistik dg SPSS Seorang psikologi ingin mengetahui hubungan antara stabilitas emosi
karyawan (X) dan kemampuan karyawan bekerja dalam kelompok (Y).
Stabilitas emosi diukur dengan uji tertulis dengan semakin tinggi skor
menyatakank stabilitas
bili emosii semakinki tinggi.
i i Kemampuan
K b k j dalam
bekerja d l
kelompok (Y = 1 jika dapat, Y = 0 jika tidak dapat) dievaluasi oleh supervisor.
Berikut data dari 27 karyawan :
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Xi 474 432 453 320 356 532 587 423 552 403 502 321 453 579
Yi 0 0 1 0 1 1 0 0 1 0 0 1 0 0
i 15 16 17 18 19 20 21 22 23 24 25 26 27
Xi 537 402 592 320 337 589 513 413 572 422 562 506 600
11 Yi 1 0 1 0 1 1 0 0 1 0 1 0 1 12
Dimisalkan model regresi logistik dapat digunakan. Model Regresi
Model Regresi
g Logistik
g Berganda
g
a. Tentukan fungsi respons dugaan.
b. Buatlah plot pencar dari data dan fungsi respons logistik • Yi merupakan peubah acak Bernoulli
dugaannya. Apakah fungsi respons dugaan cocok?
c. Tentukan exp(b1) dan berikan maknanya.
d Berapa peluang
d. l b h karyawan
bahwa k d
dengan skor
k stabilitas
bili emosii 550 • Sehingga
S hi nilai
il i harapan
h d i Yi adalah
dari d l h
akan dapat bekerja dalam kelompok?
13 14