STATISTIKA INFERENSIA
Oleh :
Analisis korelasi adalah analisis statistika yang membahas tentang derajat (kekuatan) hubungan antara
peubah-peubah.
Koefisien korelasi linear mengukur kekuatan hubungan linear antara peubah X dan Y. Koefisien
korelasi linear seringkali disebut juga dengan koefisien korelasi Pearson (ditemukan oleh Karl
Pearson pada tahun 1857-1936).
− ∑
− ∑
∑
− ∑
∑
=
∑
− ∑
∑
− ∑
(a) Korelasi positif (b) Korelasi positif yang kuat (c) Korelasi positif sempurna
antara X dan Y antara X dan Y antara X dan Y
1
(d) Korelasi negatif (e) Korelasi negatif yang kuat (f) Korelasi negatif sempurna
antara X dan Y antara X dan Y antara X dan Y
Contoh 1:
Data berikut adalah tentang banyaknya keketidakhadiran dan nilai akhir dari tujuh mahasiswa
yang dipilih secara acak dari suatu kelas Statistika.
Mahasiswa A B C D E F G
Banyaknya ketidakhadiran (X) 6 2 15 9 12 5 8
Nilai Akhir (Y) 82 86 43 74 58 90 78
2
Penyelesaian:
a) Diagram pencar bagi X dan Y, terlihat bahwa titik-titik data mengikuti arah garis lurus.
Scatterplot of Y vs X
90
80
70
Y
60
50
40
2 4 6 8 10 12 14 16
X
b) Koefisien korelasi r = -0,944 artinya ada korelasi negatif yang kuat antara banyaknya
ketidakhadiran dan nilai akhir, semakin banyak ketidakhadiran maka semakin menurun
nilai akhirnya
c) Koefisien determinasi r2 = 0,891, artinya sebesar 89,1% keragaman nilai akhir yang dapat
dijelaskan oleh hubungan linear antara banyaknya ketidakhadiran dan nilai akhir.
3
H0 : = 0 H1 : ≠ 0 H0 ditolak jika || > (
Hipotesis Nol Hipotesis Alternatif Statistik Uji Kriteria Keputusan
−2 !)
= #
H0 : = 0 H1 : < 0 1 −
H0 : ≥ 0
H0 ditolak jika t < - tα(n-2)
H0 : = 0 H1 : > 0
H0 : ≤ 0
H0 ditolak jika t > tα(n-2)
Latihan
Pada soal-soal berikut,
a. Tentukan mana yang sebagai peubah bebas dan peubah tak bebas
b. Buatlah diagram pencar
c. Tentukan koefisien korelasi dan maknanya
d. Tentukan koefisien determinasi dan maknanya
e. Apakah ada hubungan linear antara kedua peubah tersebut? Gunakan α = 0.05.
f. Apakah ada hubungan linear positif antara kedua peubah tersebut? Gunakan α = 0.05.
1. Seorang pendidik ingin mengetahui hubungan antara nilai skor tes dan nilai IPK dari
mahasiswa. Berikut data sampel.
2. Seorang peneliti ingin mengetahui apakah ada hubungan antara umur dengan lamanya
seseorang melakukan olahraga per minggu. Berikut data sampelnya.
Umur 18 26 32 38 52 59
Lamanya olahraga (jam) 10 5 2 3 1,5 1
4. Empatbelas mahasiswa telah dipilih secara acak dan diperiksa tekanan darahnya.
Berikut data tekanan darah sistolik dan diastolik (dalam mmHg).
Sistolik 138 130 135 140 120 125 120 130 130 144 143 140 130 150
Diastolik 82 91 100 100 80 90 80 80 80 98 105 85 70 100
4
Topik 2 : Analisis Regresi Linear Sederhana
Analisis regresi adalah analisis statistika yang memanfaatkan hubungan antara dua atau lebih
peubah kuantitatif sehingga salah satu peubah dapat diramalkan dari peubah lainnya.
Bila sudah diperoleh data sampel (Xi,Yi), selanjutnya hal yang penting adalah membuat diagram
pencar antara X dan Y untuk mengetahui pola dari data. Bila pola data menunjukkan linear maka
model regresi linear sederhana dapat digunakan. Perhatikan gambar berikut.
Scatterplot of Y vs X
90
80
70
Y
60
50
40
2 4 6 8 10 12 14 16
X
(a) (b)
5
(c) (d)
13,82
13 48,60
ei (sisaan ke-i)
i) adalah beda antara nilai amatan Yi dengan nilai dugaannya
Penduga bagi β0 adalah b0 dan penduga bagi β1 adalah b1 yang diperoleh dengan menyelesaikan
kedua persamaan tersebut. Sehingga diperoleh
∑ X Y − ∑ n∑
X Y i i
i i
1
b1 = 2
, b0 = (∑ Yi − b1 ∑ X i ) = Y − b1 X .
∑X − ∑
( X) 2 i
n
i
n
6
Makna dugaan koefisien regresi
Misalkan ingin mengetahui hubungan jarak tempuh kendaraan mobil dalam km (X) dengan tingkat
emisinya dalam ppm (Y).
• Plot data ternyata menunjukkan ada hubungan linear antara X dan Y
• Dicobakan model linear Yi = β0 + β1Xi + εi, diperoleh persamaan regresi Yˆi = 364 + 5,47 X i .
• Apa makna b0 dan b1 pada konteks ini ?
Makna dari b1 yaitu rata-rata emisi meningkat 5,47 ppm untuk setiap kenaikan jarak tempuh
kendaraan mobil 1 km (atau kenaikan jarak tempuh kendaraan mobil 1 km akan meningkatkan rata-
rata emisi yang dihasilkan mobil sebesar 5,47 ppm).
Makna dari b0 yaitu untuk mobil dengan jarak tempuh kendaraan mobil 0 km (mobil baru) maka
rata-rata tingkat emisi yang dihasilkan sebesar 364 ppm.
SOAL LATIHAN
1. Berikut data sampel tentang nilai mutu rata-rata (NMR) mahasiswa pada akhir tahun
pertama (Y) dan nilai ujian masuk (X).
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Xi 5,5 4,8 4,7 3,9 4,5 6,2 6,0 5,2 4,7 4,3 4,9 5,4 5,0 6,3 4,6 4,3 5,0 5,9 4,1 4,7
Yi 3,1 2,3 3,0 1,9 2,5 3,7 3,4 2,6 2,8 1,6 2,0 2,9 2,3 3,2 1,8 1,4 2,0 3,8 2,2 1,5
2. Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika
(dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama
seminggu)
Nilai ulangan matematika 95 100 100 80 70 55 50 75 55 60 65 95
Lama waktu belajar 18 18 19 17 14 5 6 10 13 4 12 10
matematika
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y.
b) Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien regresinya.
3. Suatu penelitian telah dilakukan untuk mengetahui hubungan antara pengeluaran untuk
iklan (X dalam jutaan rupiah) dengan penerimaan melalui penjualan (Y dalam jutaan rupiah)
pada perusahaan tertentu. Berikut ringkasan datanya :
n = 10, ∑ X i = 120, ∑ Yi = 500, ∑ X iYi = 6106, ∑ X i2 = 1470, ∑ Yi 2 = 25440
a) Tentukan persamaan regresi dugaan! Berikan maknanya.
b) Bila pengeluaran untuk iklan sebesar 16 juta rupiah, berapakah penerimaan dari hasil
penjualan?
7
4. Tabel ini menunjukkan skor tes penalaran verbal (X) dan skor tes Inggris (Y), untuk setiap
sampel acak dari 8 anak yang mengikuti kedua tes tersebut:
Anak A B C D E F G H
X 112 113 110 113 112 114 109 113
Y 69 65 75 70 70 75 68 76
a) Plot data dengan diagram pencar. Berikan penjelasan dari plot tersebut.
b) Tentukan persamaan regresi linear dugaan dan berikan maknanya
8
Topik 3 : Asumsi-asumsi dalam Analisis Regresi Linear Sederhana
Penyelidikan terpenuhi atau tidak asumsi-asumsi tersebut dengan menggunakan analisis sisaan.
Sisaan atau nilai dugaan galat didefinisikan sebagai
𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖
(a) Galat memiliki ragam konstan (tidak berpola) (b) Galat tidak memiliki ragam konstan (berpola)
9
𝑖−0,375
ℎ𝑖 = 𝐾𝑇𝐺 𝑧 𝑛+0,25
𝐾𝑇𝐺 = 𝐽𝐾𝐺 𝑛 − 2 , 𝐽𝐾𝐺 = 𝑌𝑖2 − 𝑏0 𝑌𝑖 − 𝑏1 𝑋𝑖 𝑌𝑖
Kriterianya: bila titik-titik (sisaan-sisaan) mengikuti arah garis diagonal maka galat menyebar
normal.
Urutan 𝑖 − 0,375
i Xi Yi Ŷi ei ei terurut 𝑧 hi
naik i 𝑛 + 0,25
1 30 73 70 3 1 -3 -4,24
2 20 50 50 0 2 -2 -2,74
3 60 128 130 -2 3 -2 -1,79
4 80 170 170 0 4 -2 -1,02
5 40 87 90 -3 5 -1 -0,33
6 50 108 110 -2 6 0 0,33
7 60 135 130 5 7 0 1,02
8 30 69 70 -1 8 2 1,79
9 70 148 150 -2 9 3 2,74
10 60 132 130 2 10 5 4,24
10
Kriterianya : apabila titik-titik sisaan berfluktuasi secara acak di sekitar nol maka dapat dikatakan
bahwa galat saling bebas.
(a) (b)
Gambar (a) Plot waktu versus sisaan menunjukkan bahwa titik-titik sisaan tidak berfluktuasi
secara acak disekitar nol maka galat tidak saling bebas.
Gambar (b) Plot nilai dugaan versus sisaan menunjukkan bahwa titik-titik sisaan berfluktuasi
secara acak disekitar nol maka galat saling bebas.
11
Topik 4 : Inferensi dalam Analisis Regresi Linear Sederhana
Inferensi terhadap 1
a. Selang Kepercayaan bagi 1
b 1
Diketahui bahwa 1 ~ tn 2 , sehingga
sb1
b
P t ;n 2 1 1 t ;n2 1
2
sb1 2
→ 𝑃 𝑏1 − 𝑡𝛼 (𝑛 −2) 𝑠 𝑏1 ≤ 𝛽1 ≤ 𝑏1 + 𝑡𝛼 (𝑛 −2) 𝑠 𝑏1 =1−𝛼
2 2
𝐾𝑇𝐺
dengan 𝑠 2 𝑏1 = 2
𝑋𝑖
𝑋𝑖2 −
𝑛
Jadi selang kepercayaan 100(1-) bagi 1 adalah
𝑏1 − 𝑡𝛼 (𝑛 −2) 𝑠 𝑏1 ≤ 𝛽1 ≤ 𝑏1 + 𝑡𝛼 (𝑛 −2) 𝑠 𝑏1
2 2
b. Uji bagi 1
12
Perhatikan simpangan total berikut:
Y Y Yˆ Y Y Yˆ
i i i i
Y Y Yˆ Y Y Yˆ
2 2 2
i i i i
X i Yi
2
Yi
2 X iYi
n
Yi 2
X
X i2 n i
2
n
Inferensi terhadap 0
a. Selang Kepercayaan bagi 0
b 0
Diketahui bahwa 0 ~ t n2 , sehingga
sb0
b 0
P t ;n2 0 t ;n2 1
2 sb0 2
→ 𝑃 𝑏0 − 𝑡𝛼 (𝑛 −2) 𝑠 𝑏0 ≤ 𝛽0 ≤ 𝑏0 + 𝑡𝛼 (𝑛 −2) 𝑠 𝑏0 = 1−𝛼
2 2
1 𝑋2
dengan 𝑠 2 𝑏0 = 𝐾𝑇𝐺 + 2
𝑛 𝑋𝑖
𝑋𝑖2 −
𝑛
13
Misalkan diperoleh selang kepercayaan 90% bagi 0
5,34 0 14,66
Artinya diduga bahwa rata-rata Y sekitar antara 5,34 sampai 14,66 satuan untuk X
sebesar 0.
Selang kepercayaan bagi 0 ini tidak selalu memberikan informasi yang bermanfaat.
b. Uji bagi 0
14
Misalkan diperoleh selang prediksi 90% bagi 𝑌ℎ(𝑏𝑎𝑟𝑢 ) dengan Xh = 100 adalah
332,2 ≤ 𝑌ℎ(𝑏𝑎𝑟𝑢 ) ≤ 506,6
Maknanya dengan tingkat kepercayaan 90% dapat diprediksikan bahwa rata-rata Y untuk
proses berikutnya pada X sebesar 100 adalah 332,2 sampai 506,6 satuan.
SOAL LATIHAN
1. Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika
(dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama
seminggu).
Nilai ulangan matematika 95 100 100 80 70 55 50 75 55 60 65 95
Lama waktu belajar matematika 18 18 19 17 14 5 6 10 13 4 12 10
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!
Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
b) Tentukan selang kepercayaan 99% bagi 0 dan 1 beserta maknanya!
c) Ujilah apakah ada hubungan linear antara lama waktu belajar matematika dan nilai ulangan
matematika? Gunakan taraf nyata = 0,01.
d) Ujilah apakah 1 = 5 lawan 1 5 ? Gunakan taraf nyata = 0,01.
e) Ujilah apakah 0 = 0 atau tidak? Gunakan taraf nyata = 0,01.
f) Tentukan selang prediksi 95% bagi Yh(baru) dengan Xh = 15
2. Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang memperoleh nilai di bawah 35
tidak diizinkan mengikuti kuliah matematika yang biasa, tetapi harus mengikuti suatu kelas
khusus (remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi 20 mahasiswa
yang mengikuti kuliah matematika yang biasa:
𝑋𝑖 = 1110; 𝑌𝑖 = 1173; 𝑋𝑖 𝑌𝑖 = 67690; 𝑋𝑖2 = 67100; 𝑌𝑖2 = 74725
a. Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!
b. Tentukan persamaan regresi dugaan!
c. Bila 60 adalah nilai terendah agar lulus dari pelajaran matematika tersebut, berapakah batas
nilai tes terendah di masa mendatang untuk dapat diizinkan mengikuti kuliah tersebut?
Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
d. Ujilah apakah ada hubungan linier antara nilai tes dan nilai akhir? Gunakan taraf nyata 0,05.
e. Tentukan selang kepercayaan 95% bagi 0 dan 1 beserta maknanya.
f. Tentukan selang kepercayaan 95% bagi 𝐸 𝑌ℎ dengan Xh = 75 beserta maknanya.
15
3. Suatu percobaan dilakukan pada jenis mobil baru merk tertentu, untuk menentukan jarak yang
dibutuhkan untuk berhenti bila mobil tersebut direm pada berbagai kecepatan. Data yang
diperoleh sebagai berikut:
Analisis Variansi
Uji F untuk Ketidakcocokkan Model Regresi Linear Sederhana
• Uji ini mengasumsikan bahwa pengamatan-pengamatan Y untuk suatu X tertentu bersifat bebas,
tersebar normal, memiliki ragam yang sama.
• Uji ini menghendaki adanya pengamatan berulang pada satu atau lebih nilai X.
Hipotesis
H0 : E{Y} = 0+ 1X
H1 : E{Y} 0+ 1X
Atau
H0 : Tidak ada ketidakcocokan model regresi linear sederhana dengan data
H1 : Ada ketidakcocokan model regresi linear sederhana dengan data
Atau
H0 : Model regresi linear sederhana cocok
H1 : Model regresi linear sederhana tidak cocok
Taraf nyata:
Statistik Uji :
J KKM k 2
F
JKGM n k
Kriteria keputusan :
H0 ditolak jika Fhit > Fα(k-2,n-k)
16
Perhatikan berikut ini:
Y Yˆij Y
Y j Y j Yˆij
2 2 2
ij ij
Contoh:
Lakukan uji kecocokan model regresi linear sederhana dengan taraf nyata 0,05 pada data sampel berikut.
i Xi Yi Xi Yi 𝑌𝑗
1 125 160 75 28 35
2 100 112 42
3 200 124 100 112 124
4 75 28 136
5 150 152 125 160 155
6 175 156 150
7 75 42 150 152 152
8 175 124 175 156 140
9 125 150 124
10 200 104 200 124 114
11 100 136 104
Hipotesis
H0 : E{Y} = 0+ 1X
H1 : E{Y} 0+ 1X
Taraf nyata : = 0,05
Statistik Uji : F = KTKM/KTGM
Kriteria keputusan:
n=11, k=6, db(KM)=k-2=6-2=4 ,db(GM)=n-k=11-6=5
F0,05(4,5)=5,19
H0 ditolak jika Fhit > 5,19
Hitungan:
JKG=170696-(50,722511288)-(0,48670 186200)=14742
JKGM=(28-35)2+(42-35)2+(112-124)2+(136-124)2+(160-155)2+(150-155)2+(152-152)2+(156-140)2+(124-
140)2+(124-114)2+(104-114)2=1148
JKKM=JKG-JKGM=14742-1148=13594
F=(13594/4)/(1148/5)=14,80
Kesimpulan : Karena Fhit=14,80>5,19 maka H0 ditolak
Jadi dengan taraf nyata 0,05 dapat disimpulkan bahwa model regresi linear sederhana tidak cocok
digunakan.
17
SOAL LATIHAN
Seorang kimiawan mempelajari hubungan konsentrasi suatu larutan (Y) dengan waktu (X). Berikut data
sampel yang diperoleh:
i Xi Yi
5 7 0,17
6 7 0,21
7 5 0,49
8 5 0,58
9 5 0,53
10 3 1,22
11 3 1,15
12 3 1,07
13 1 2,84
14 1 2,57
15 1 3,10
18
Topik 5 : Pendekatan Matriks terhadap Analisis Regresi Linear Sederhana
Perhatikan bahwa Xβ
β adalah vektor nilai-nilai harapan bagi amatan-amatan Yi sebab E{Yi}= β0+β1Xi,
sehingga
E{Y} = X β
n×1 n×2 2×1
Asumsi : ε adalah suatu vektor peubah acak normal yang bebas dengan E{εε } = 0 dan =
Persamaan normal regresi linear sederhana :
+ ∑ = ∑
∑ + ∑ = ∑
19
1 X 1
1 1 K 1 1 X 2 n ∑X i
X' X = =
X1 X 2 K X n M M ∑ X i ∑X i
2
1 X n
Y1
1 1 K 1 Y2 ∑ Yi
X' Y = =
X1 X 2 K X n M ∑ X i Yi
Yn
−1 1 ∑ X i2 − ∑ Xi
(X' X ) =
n∑ X i2 − (∑ X i ) − ∑ X i
2
n
Uji terhadap β1
Untuk menguji apakah ada hubungan linear antara Y dengan X, dilakukan pengujian berikut :
Hipotesis :
H0 : β 1 = 0
H1 : β 1 ≠ 0
Taraf nyata : α
Statistik Uji :
⁄
=
⁄!
Kriteria Keputusan :
H0 ditolak jika Fhit > Fα(1,n-2)
1
JKT = Y' Y − Y' JY , Y' Y = ∑ Yi 2 , Y' JY = (∑ Yi )
2
JKG = Y' Y − b' X' Y ,
n
1 L 1
J = M M M
1 L 1
2 −1 2
s 2 {b0 } s{b0 , b1 }
s {b} = KTG (X' X ) , s {b} = 2
s{b1 , b0 } s {b1 }
20
SOAL LATIHAN
1. Suatu percobaan telah dilakukan untuk menentukan apakah berat seekor kambing (dalam
kilogram) dapat diprediksikan (setelah pada periode tertentu) berdasarkan jumlah makanan yang
dimakan (dalam kilogram). Berikut data yang telah dinyatakan dalam notasi matriks.
10 379 825
X' X = , X' Y = , Y' Y = [70083], Y' JY = [680625]
379 14533 31726
2. Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika
(dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama
seminggu).
Nilai ulangan matematika 95 100 100 80 70 55 50 75 55 60 65 95
Lama waktu belajar matematika 18 18 19 17 14 5 6 10 13 4 12 10
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!
Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
b) Tentukan selang kepercayaan 99% bagi β0 dan β1 beserta maknanya!
c) Ujilah apakah ada hubungan linear antara lama waktu belajar matematika dan nilai ulangan
matematika? Gunakan taraf nyata α = 0,01.
21
Topik 6 : Analisis Regresi Linear Ganda
Analisis regresi linear ganda adalah analisis statistika yang digunakan untuk mengetahui
hubungan linear antara satu peubah tak bebas Y dengan beberapa peubah bebas (X1, X2, …,
Xp-1).
Persamaan Normal
b0 n b1 X i1 b2 X i 2 b p 1 X ip 1 Yi
b0 X i1 b1 X i21 b2 X i1 X i 2 b p 1 X i1 X ip 1 X i1Yi
b0 X i 2 b1 X i1 X i 2 b2 X i22 b p 1 X i 2 X ip 1 X i 2Yi
b0 X ip 1 b1 X i1 X ip 1 b2 X i 2 X ip 1 b p 1 X ip2 1 X ip 1Yi
X 12 X n 2 X i 2 X X X
2
X 22
X n2
i2 i1 i2
1 X n1
Y
1 1 1 1 Yi
X' Y X 11 X n1 2 X i1Yi
Y
X 21
X 12 X 22 X n 2 X i 2Yi
Yn
b X' X X' Y
1
22
Memaknai Persamaan Regresi Dugaan
Misalkan : Ingin mengetahui apakah volume penjualan (Y, gros) berhubungan dengan jumlah
penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar).
Diperoleh persamaan regresi dugaannya ialah
Yˆ 3,453 0,496 X 0,00920 X
1 2
Persamaan ini menunjukkan bahwa rataan volume penjualan diharapkan akan naik 0,496
gros bila jumlah penduduk naik 1 ribu jiwa kalau pendapatan per kapita tetap, dan bahwa
rataan volume penjualan diharapkan akan naik 0,0092 gros bila pendapatan per kapita naik 1
dolar kalau jumlah penduduk tetap. Bila jumlah penduduk sebesar 0 jiwa dan pendapatan
per kapita 0 dollar maka rata-rata volume penjualan sebesar 3,453 gros (tidak bermakna).
1
JKT Y' Y Y' JY , JKG Y' Y b' X' Y
n
Uji terhadap k
Hipotesis Hipotesis Statistik Uji Kriteria keputusan
Nol Alternatif
H0 : k = c H1 : k c 𝑏𝑘 − 𝑐 H0 ditolak jika |thit| > 𝑡𝛼 𝑛 −𝑝
𝑡= 2
H0 : k c H1 : k > c 𝑠 𝑏𝑘 H0 ditolak jika thit > 𝑡𝛼 𝑛 −𝑝
H0 : k = c
H0 : k c H1 : k < c H0 ditolak jika thit < −𝑡𝛼 𝑛 −𝑝
H0 : k = c
s 2 b KTGX' X
1
23
s 2 b0 sb0 , b1 sb0 , b p 1
sb1 , b0 s 2 b1 sb1 , b p 1
s b
2
sb p 1 , b0 sb p 1 , b1 s b p 1
2
24
Koefisien Determinasi Ganda (R2)
R2 = JKR/JKT = 1- (JKG/JKT)
Koefisien ini mengukur proporsi pengurangan keragaman total di dalam Y akibat
digunakannya peubah-peubah bebas
X1,X2, …, Xp-1.
Sifat koefisien determinasi ganda : 0 R2 1.
R2 akan bernilai 0 bila semua bk = 0 (k=1,…,p-1). R2 akan bernilai 1 bila semua amatan Y
berada tepat pada permukaan respons dugaannya, Yi = Ŷi untuk semua i.
25
Hipotesis
H0 : E{Y} = 0+ 1X1+ 2X2 + …+ p-1Xp-1
H1 : E{Y} 0+ 1X1 + 2X2 + …+ p-1Xp-1
Atau
H0 : Tidak ada ketidakcocokan model regresi linear ganda dengan data
H1 : Ada ketidakcocokan model regresi linear ganda dengan data
Atau
H0 : Model regresi linear ganda cocok
H1 : Model regresi linear ganda tidak cocok
Taraf nyata:
Statistik Uji:
JKKM k p
F
JKGM n k
Kriteria Keputusan
H0 ditolak jika Fhit > Fα(k-p,n-k)
Dengan
JKGM Yij Y j , JKG Y' Y b' X' Y , JKKM JKG JKGM
2
Contoh
Perhatikan data tentang kesukaan merk berikut
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Xi1 4 4 4 4 6 6 6 6 8 8 8 8 10 10 10 10
Xi2 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4
Yi 64 73 61 76 72 80 71 83 83 89 86 93 88 95 94 100
Y : derajat kesukaan terhadap merk , X1 : kandungan uap air, X2 : kemanisan produk
k = 8, JKG = 94,3, Ŷ = 37,650 + 4,425 X1 + 4,375 X2
Ujilah ketidakcocokan model regresi linear ganda dengan taraf nyata 0,01.
26
8 4
10 2
10 4
Hipotesis
H0 : E{Y} = 0+ 1X1+ 2X2
H1 : E{Y} 0+ 1X1+2X2
Taraf nyata : = 0,01
Statistik Uji:
JKKM k p
F
JKGM n k
Kriteria keputusan:
n=16, k=8, db(KM)=k-p=8-3=5 ,db(GM)=n-k=16-8=8, F0,05(5,8)= 3,69
H0 ditolak jika Fhit > 3,69
Hitungan:
SOAL LATIHAN
1. Suatu penelitian telah dilakukan untuk mengetahui hubungan antara persentase
kehadiran mahasiswa (X1) dan lama belajar dalam jam per minggu (X2) terhadap nilai
akhir ujian suatu mata kuliah (Y). Sebanyak 30 mahasiswa telah dipilih secara acak untuk
menjadi subyek penelitian.
Diketahui :
9,8866861 0,132528 0,640573
XX 0,132528 0,0018375 0,010051
1
27
f) Hitunglah koefisien korelasi ganda.
2. Seorang pegawai administrasi rumah sakit ingin mengetahui hubungan antara kepuasan
pelanggan (Y) dan umur pasien (X1, dalam tahun), tingkat keparahan penyakit (X2, dalam
indeks) dan tingkat kecemasan (X3, dalam indeks). Ia mengambil secara acak 23 pasien
dan mengumpulkan data tersebut. Berikut datanya:
i 1 2 3 4 5 6 7 8 9 10 11 12
Xi1 50 36 40 41 28 49 42 45 52 29 29 43
Xi2 51 46 48 44 43 54 50 48 62 50 48 53
Xi3 2,3 2,3 2,2 1,8 1,8 2,9 2,2 2,4 2,9 2,1 2,4 2,4
Yi 48 57 66 70 89 36 46 54 26 77 89 67
i 13 14 15 16 17 18 19 20 21 22 23
Xi1 38 34 53 36 33 29 33 55 29 44 43
Xi2 55 51 54 49 56 46 49 51 52 58 50
Xi3 2,2 2,3 2,2 2,0 2,5 1,9 2,1 2,4 2,3 2,9 2,3
Yi 47 51 57 66 79 88 60 49 77 52 60
3. Seorang peneliti ingin mengevaluasi hubungan antara gaji tahuan peneliti matematika
golongan menengah dan senior (Y, dalam ribuan dolar) dan indeks kualitas publikasi (X1),
jumlah tahun pengalaman (X2) dan indeks kesuksesan dalam memperoleh hibah (X3).
Berikut data sampel 24 peneliti matematika golongan menengah dan senior.
i 1 2 3 4 5 6 7 8 9 10 11 12
Xi1 3,5 5,3 5,1 5,8 4,2 6,0 6,8 5,5 3,1 7,2 4,5 4,9
Xi2 9 20 18 33 31 13 25 30 5 47 25 11
Xi3 6,1 6,4 7,4 6,7 7,5 5,9 6,0 4,0 5,8 8,3 5,0 6,4
Yi 33,2 40,3 38,7 46,8 41,4 37,5 39,0 40,7 30,1 52,9 38,2 31,8
i 13 14 15 16 17 18 19 20 21 22 23 24
Xi1 8,0 6,5 6,6 3,7 6,2 7,0 4,0 4,5 5,9 5,6 4,8 3,9
Xi2 23 35 39 21 7 40 35 23 33 27 34 15
Xi3 7,6 7,0 5,0 4,4 5,5 7,0 6,0 3,5 4,9 4,3 8,0 5,0
Yi 43,3 44,1 42,8 33,6 34,2 48,0 38,0 35,9 40,4 36,8 45,2 35,1
28
Anggap asumsi-asumsi dalam model regresi linear ganda terpenuhi.
a. Tentukan fungsi regresi dugaan
b. Ujilah hubungan regresi, gunakan taraf nyata 0,05.
c. Ujilah apakah masing-masing k signifikan. Gunakan taraf nyata 0,05.
d. Tentukan selang kepercayaan serempak bagi 1, 2 dan 3 dengan tingkat
kepercayaan 95%. Interpretasikan hasilnya.
e. Hitung koefisien korelasi determinasi dan berikan maknanya.
f. Buatlah selang kepercayaan 95% bagi masing-masing k.
29
Topik 7 : Asumsi-asumsi dalam Analisis Regresi Linear Ganda
Linearitas
Model regresi linear ganda diasumsikan linear dalam parameter regresi. Asumsi linearitas dalam
regresi ganda lebih sulit dipenuhi berkaitan dimensi data yang semakin tinggi.
Asumsi ini dapat dideteksi dengan plot pencar sisaan dibakukan dengan masing-masing peubah
bebas.
Kriteria: asumsi ini terpenuhi bila pada plot ini menunjukkan titik-titik berpencar secara acak, bila
berpola maka mengindikasikan terjadinya pelanggaran asumsi. Jika asumsi linearitas tidak terpenuhi
maka lakukan transformasi pada Y dan atau peubah bebas tertentu.
Pada Gambar 1, pada masing-masing plot menunjukkan bahwa titik-titik berpencar secara acak
sehingga asumsi linearitas dalam parameter regresi terpenuhi.
Multikolinearitas
Multikolinearitas atau kekolinearan ganda adalah terjadinya korelasi antar peubah bebas.
Model regresi yang baik seharusnya tidak terjadi korelasi antar peubah bebas.
Metode yang banyak digunakan untuk mendeteksi adanya multikolinearitas adalah faktor inflasi
ragam (variance inflation factor/VIF) dengan rumus
VIFk (1 Rk2 ) 1 , k 1,2,..., p 1
Rk2 adalah koefisien determinasi ganda bila Xk diregresikan terhadap p-2 peubah lainnya di dalam
model.
30
Kriteria terjadinya multikolinearitas adalah VIF > 10 atau nilai TOLERANCE < 0,1
(TOLERANCE = 1/VIF)
Heteroskedastisitas
Ragam galat diasumsikan konstan dari satu pengamatan ke pengamatan lain, hal ini disebut
homoskedastisitas.
Jika ragam galat berbeda disebut heteroskedastisitas.
Model regresi yang baik adalah tidak terjadi heteroskedastisitas.
Untuk mendeteksi heteroskedastisitas adalah dengan membuat plot nilai dugaan yang
dibakukan (standardized predicted value) dengan sisaan yang dibakukan (studentized residual).
Jika ada pola tertentu (bergelombang, melebar kemudian menyempit) maka terjadi
heteroskedastisitas.
Jika tidak ada pola jelas, maka tidak terjadi heteroskedastisitas.
Pada Gambar 2, plot menunjukkan bahwa titik-titik berpencar secara acak (tidak berpola) yang
mengindikasikan homoskedastisitas. (Galat memiliki ragam yang sama).
Normalitas
Galat diasumsikan berdistribusi Normal i ~ N 0, 2 .
Model regresi yang baik adalah distribusi data normal atau mendekati normal.
Untuk mendeteksi normalitas digunakan normal p-p plot.
Jika titik-titik (sisaan) menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka
model regresi memenuhi asumsi normalitas.
Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan atau tidak mengikuti arah garis
diagonal, maka model regresi tidak memenuhi asumsi normalitas.
31
Gambar 3. Plot P-P Normal
Pada Gambar 3 terlihat bahwa titik-titik dekat dengan garis diagonal sehingga galat memiliki
distribusi normal.
Autokorelasi
Bila dalam model regresi linear ganda ada korelasi antara galat pada periode t dengan galat pada
periode t-1, maka dinamakan ada masalah autokorelasi.
Model regresi yang baik adalah model regresi yang bebas dari autokorelasi.
Autokorelasi sering ditemukan pada regresi yang datanya adalah time series atau berdasarkan
waktu berkala seperti bulanan, tahunan.
Deteksi autokorelasi dengan menggunakan besaran Durbin -Watson (D-W)
n
(e ei i 1 )2
d i 2
n
e
i 1
2
i
32
SOAL LATIHAN
Sebuah studi untuk mengetahui hubungan lama bekerja dan kepuasan kerja dengan pendapatan.
Berikut data sampel dari sembilan pekerja.
33
34
Topik 8 : Jumlah Kuadrat Ekstra
Definisi
Jumlah kuadrat esktra 𝐽𝐾𝑅 𝑋2 𝑋1 mengukur pengaruh marjinal akibat penambahan X2 dalam
model regresi yang sudah ada X1.
𝐽𝐾𝑅 𝑋2 𝑋1 = 𝐽𝐾𝑅 𝑋1 , 𝑋2 − 𝐽𝐾𝑅 𝑋1 atau
𝐽𝐾𝑅 𝑋2 𝑋1 = 𝐽𝐾𝐺 𝑋1 − 𝐽𝐾𝐺 𝑋1 , 𝑋2
Perluasan
𝐽𝐾𝑅 𝑋3 𝑋1 , 𝑋2 = 𝐽𝐾𝑅 𝑋1 , 𝑋2 , 𝑋3 − 𝐽𝐾𝑅 𝑋1 , 𝑋2 atau
𝐽𝐾𝑅 𝑋3 𝑋1 , 𝑋2 = 𝐽𝐾𝐺 𝑋1 , 𝑋2 − 𝐽𝐾𝐺 𝑋1 , 𝑋2 , 𝑋3
Contoh 1
Perhatikan tabel berikut
Yˆ 1,496 0,8572 X 1 Yˆ 23,634 0,8565 X 2
Sumber JK db KT Sumber variasi JK db KT
variasi
Regresi JKR(X2)=381,97 1 381,97
Regresi JKR(X1)=352,27 1 352,27
Galat JKG(X2)=113,42 18 6,30
Galat JKG(X1)=143,12 18 7,95
Total 495,39 19
Total 495,39 19
35
Jumlah kuadrat galat bila X1 dan X2 ada dalam model, 𝐽𝐾𝐺 𝑋1 , 𝑋2 = 109,95 lebih kecil
dibandingkan bila dalam model hanya ada X1, 𝐽𝐾𝐺 𝑋1 = 143,12.
Jumlah kuadrat ekstra untuk pengaruh marjinal akibat penambahan X2 dalam model regresi
yang sudah ada X1.
𝐽𝐾𝑅 𝑋2 𝑋1 = 𝐽𝐾𝐺 𝑋1 − 𝐽𝐾𝐺 𝑋1 , 𝑋2 = 143,12 − 109,95 = 33,17
atau 𝐽𝐾𝑅 𝑋2 𝑋1 = 𝐽𝐾𝑅 𝑋1 , 𝑋2 − 𝐽𝐾𝑅 𝑋1 = 385,44 − 352,27 = 33,17
Jumlah kuadrat ekstra untuk pengaruh marjinal akibat penambahan X3 dalam model regresi
yang sudah ada X1 dan X2.
𝐽𝐾𝑅 𝑋3 𝑋1 , 𝑋2 = 𝐽𝐾𝐺 𝑋1 , 𝑋2 − 𝐽𝐾𝐺 𝑋1 , 𝑋2 , 𝑋3 = 109,95 − 98,41 = 11,54
atau 𝐽𝐾𝑅 𝑋3 𝑋1 , 𝑋2 = 𝐽𝐾𝑅 𝑋1 , 𝑋2 , 𝑋3 − 𝐽𝐾𝑅 𝑋1 , 𝑋2 = 396,98 − 385,44 = 11,54
Tabel 1. Contoh Tabel ANOVA dengan Dekomposisi JKR untuk Tiga Peubah X
Sumber Variasi JK db KT
Regresi JKR(X1, X2, X3) 3 KTR(X1, X2, X3)
X1 JKR(X1) 1 KTR(X1)
X2|X1 JKR(X2|X1) 1 KTR(X2|X1)
X3|X1,X2 JKR(X3|X1,X2) 1 KTR(X3|X1,X2)
Galat JKG(X1, X2, X3) n-4 KTG(X1, X2, X3)
Total JKT n-1
Uji masing-masing 𝜷𝒌 = 𝟎
Bentuk 𝛽𝑘 𝑋𝑘 dapat dikeluarkan dari model regresi ganda, dengan hipotesis alternatif sebagai
berikut
36
Hipotesis :
H0 : k= 0
H1 : k 0
Taraf nyata :
Statistik Uji :
JKR X k X 1 ,, X k 1 , X k 1 ,, X p 1 JKG X 1 ,, X p 1
F :
1 n p
KTRX k X 1 ,, X k 1 , X k 1 ,, X p 1
KTG
Kriteria Keputusan :
H0 ditolak jika Fhit > F(1,n-p)
F
JKR X q ,, X p 1 X 1 ,, X q 1 : JKG X ,, X
1 p 1
pq n p
KTR X q ,, X p 1 X 1 ,, X q 1
KTG
Kriteria Keputusan :
H0 ditolak jika Fhit > F(p-q,n-p)
37
Misalkan model regresi orde pertama dengan tiga peubah bebas
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝛽3 𝑋𝑖3 + 𝜀𝑖
Uji apakah 𝛽3 = 0.
Hipotesis Nol Hipotesis Statistik Uji Kriteria keputusan
Alternatif
H0 : 𝛽3 = 0 H1 : 𝛽3 ≠ 0 𝐽𝐾𝑅 𝑋3 𝑋1 , 𝑋2 1 H0 ditolak jika
𝐹=
𝐽𝐾𝐺 𝑋1 , 𝑋2 , 𝑋3 𝑛 − 4 𝐹 > 𝐹𝛼 (1,𝑛 −4)
Contoh 2
Dari contoh 1. Apakah X3 dapat dikeluarkan dari model regresi? Gunakan taraf nyata 𝛼 = 0.01.
Hipotesis
H0 : 𝛽3 = 0
H1 : 𝛽3 ≠ 0
Taraf nyata: 𝛼 = 0,01
𝐽𝐾 𝑅 𝑋3 𝑋1 ,𝑋2 1
Statistik Uji: 𝐹 = 𝐽𝐾𝐺 𝑋1 ,𝑋2 ,𝑋3 𝑛 −4
Kriteria keputusan: F0,01(1,20-4) = F0,01(1,16) = 8,53
H0 ditolak jika 𝐹ℎ𝑖𝑡 > 8,53
Hitungan:
11,54 1
𝐹 = 98,41 = 1,88
16
Kesimpulan:
Karena Fhit = 1,88 < 8,53 maka H0 diterima. (𝛽3 = 0)
Jadi pada taraf nyata 0,01 dapat disimpulkan bahwa X3 dapat dikeluarkan dari model regresi.
Contoh 3
Dari contoh 1. Apakah X2 dan X3 dapat dikeluarkan dari model regresi? Gunakan taraf nyata
𝛼 = 0,01.
38
Hipotesis
H0 : 𝛽2 = 𝛽3 = 0
H1 : Tidak semua 𝛽2 dan 𝛽3 sama dengan nol
Taraf nyata: 𝛼 = 0,01
𝐽𝐾𝑅 𝑋2 ,𝑋3 𝑋1 2
Statistik Uji: 𝐹 = 𝐽𝐾𝐺 𝑋1 ,𝑋2 ,𝑋3 𝑛 −4
Kriteria keputusan: F0,01(1,20-4) = F0,01(2,16) = 6,23
H0 ditolak jika 𝐹ℎ𝑖𝑡 > 3,63
Hitungan:
44,71/2
𝐹 = 98,41 = 3,63
16
Hitungan:
Karena Fhit = 3,63 < 6,23 maka H0 diterima. (𝛽2 = 𝛽3 = 0)
Jadi pada taraf nyata 0,01 dapat disimpulkan bahwa X2 dan X3 dapat dikeluarkan dari model
regresi.
JKR X 2 X 1 33,17
Misalkan diperoleh rY22.1 0,232 , artinya jika X2 dimasukkan ke dalam
JKG X 1 143,12
model regresi yang di dalamnya sudah ada X1 maka JKG akan berkurang 23,2%.
39
Koefisien Korelasi Parsial
a. Koefisien korelasi parsial merupakan akar kuadrat koefisien determinasi parsial.
b. Koefisien ini mempunyai tanda yang sama dengan koefisien regresi padanannya di dalam
fungsi regresi dugaannya.
Contoh 4
Dari contoh 1. Tentukan koefisien korelasi parsial X2 bila X1 sudah ada dalam model regresi?
Yˆ 19,174 0,2224 X 0,6594 X
1 2
2
𝑟𝑌2|1 = 𝑅𝑌2|1 = 0,232 = 0,482
Koefisien 𝑟𝑌2|1 ini bernilai positif karena b2 = 0,6594 bernilai positif.
40
Topik 9 : Seleksi Model
Best-Subset Regression
Kriteria dalam memilih model terbaik pada best-subset regression:
1. Cp, pilih nilai Cp p+1 (Cp mengukur ketepatan model)
2. S, pilih nilai simpangan baku yang terkecil ( 𝑠 = 𝐾𝑇𝐺)
3. R2adj, pilih nilai R2adj mendekati 1 (100%)
4. Prinsip parsimony, model dengan peubah bebas yang lebih sedikit adalah lebih baik
daripada lebih banyak peubah bebas.
Contoh 1
Berikut hasil output Minitab
Best Subsets Regression: Y versus X1, X2, X3, X4
Response is Y
Mallows X X X X
Vars R-Sq R-Sq(adj) Cp S 1 2 3 4
1 36.6 34.0 13.3 38.621 X
1 17.1 13.7 24.2 44.162 X
2 49.0 44.6 8.4 35.387 X X
2 45.0 40.2 10.6 36.749 X X
3 53.8 47.5 7.8 34.443 X X X
3 53.6 47.3 7.8 34.503 X X X
4 62.3 55.1 5.0 31.835 X X X X
41
Forward Regression
Pada metode forward regression, penambahan peubah bebas ke dalam model dilakukan satu
per satu berdasarkan kekuatan koefisien korelasi.
Contoh 2
Berikut hasil output Minitab
Stepwise Regression: Y versus X1, X2, X3, X4
Step 1 2 3 4
Constant -272.4 -330.7 -283.7 -330.8
X3 -0.16 -0.30
T-Value -1.48 -2.52
P-Value 0.153 0.020
X4 0.131
T-Value 2.20
P-Value 0.039
42
Model terbaik adalah 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4 + 𝜀, karena memiliki nilai R2adj =
55,13 terbesar, R2 = 62,31 terbesar , Cp Mallows = 5,0 ( 5) dan S = 31,8 terkecil.
Backward Regression
Pada metode backward regression, diawali dengan memasukan semua peubah bebas ke dalam
model lalu mengeluarkan peubah bebas yang memiliki nilai R2 terkecil.
Contoh 3
Berikut hasil output Minitab
Stepwise Regression: Y versus X1, X2, X3, X4
Backward elimination. Alpha-to-Remove: 0.1
Step 1
Constant -330.8
X1 1.25
T-Value 3.02
P-Value 0.006
X2 -0.118
T-Value -2.18
P-Value 0.041
X3 -0.30
T-Value -2.52
P-Value 0.020
X4 0.131
T-Value 2.20
P-Value 0.039
43
S 31.8
R-Sq 62.31
R-Sq(adj) 55.13
Mallows Cp 5.0
Stepwise Regression
Pada metode stepwise regression merupakan kombinasi antara forward dan backward.
Contoh 4
Berikut hasil output Minitab
Step 1 2
Constant -272.4 -330.7 Model terbaik adalah 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝜀, karena
memiliki nilai R2adj = 44,56 terbesar, R2 = 48,99 terbesar ,
X1 1.42 1.76
T-Value 3.72 4.66 Cp Mallows = 8,4 (> 3) tidak memenuhi dan S = 35,4
P-Value 0.001 0.000 terkecil.
X2 -0.139
T-Value -2.36
P-Value 0.027
S 38.6 35.4
R-Sq 36.60 48.99
R-Sq(adj) 33.96 44.56
Mallows Cp 13.3 8.4
44
SOAL LATIHAN
Data 1
Seorang direktur operasi penyiaran di suatu stasiun televisi ingin mempelajari tentang “jam
siaga” . Ia ingin memperoleh model terbaik untuk memprediksikan berapa jumlah jam siaga per
minggu (Y) bagi pekerja. Peubah bebas yang telah tersedia adalah jumlah pekerja yang hadir
(X1), jumlah jam istirahat (X2), jumlah jam sibuk (X3) dan total jam kerja (X4). Berikut data selama
26 minggu.
i Y X1 X2 X3 X4 i Y X1 X2 X3 X4
1 245 338 414 323 2001 14 161 307 402 207 1720
2 177 333 598 340 2030 15 274 322 151 287 2056
3 271 358 656 340 2226 16 245 335 228 290 1890
4 211 372 631 352 2154 17 201 350 271 355 2187
5 196 339 528 380 2078 18 183 339 440 300 2032
6 135 289 409 339 2080 19 237 327 475 284 1856
7 195 334 382 331 2073 20 175 328 347 337 2068
8 118 293 399 311 1758 21 152 319 449 279 1813
9 116 325 343 328 1624 22 188 325 336 244 1808
10 147 311 338 353 1889 23 188 322 267 253 1834
11 154 304 353 518 1988 24 197 317 235 272 1973
12 146 312 289 440 2049 25 261 315 164 223 1839
13 115 283 388 276 1796 26 232 331 270 272 1935
Tentukan model terbaik dengan kriteria best-subsets regression, forward selection dan backward
elimination.
Data 2
Data tentang rumah sakit. Peubah tak bebas adalah jumlah jam perawat bekerja per bulan (Y) dan
peubah bebas adalah rata-rata jumlah pasien per hari (X1), jumlah pasien yang rontgen (X2), jumlah
tempat tidur yang terisi per bulan (X3), rata-rata daya tampung pasien baru yang menginap (X4) dan
rata-rata lama pasien menginap (X5).
i Y X1 X2 X3 X4 X5
1 566,5 15,57 2463 472,9 18 4,45
2 696,8 44,02 2048 1339,8 9,5 6,92
3 1033,2 20,42 3940 620,3 12,8 4,28
4 1603,6 18,74 6505 568,3 36,7 3,9
5 1611,4 49,20 5723 1497,6 35,7 5,5
6 1613,3 44,92 11520 1365,8 24 4,6
7 1854,2 55,48 5779 1687 43,3 5,62
8 2160,6 59,28 5969 1639,9 46,7 5,15
9 2305,6 94,39 8461 2872,3 78,7 6,18
45
10 3503,9 128,02 20106 3655,1 180,5 6,15
11 3571,9 96,00 13313 2912 60,9 5,88
12 3741,4 131,42 10771 3921 103,7 4,88
13 4026,5 127,21 15543 2865,7 126,8 5,5
14 10343,8 252,90 36194 7684,1 157,7 7
15 11732,2 409,20 34703 12446,3 169,4 10,78
16 15414,9 463,70 39204 14098,4 331,4 7,05
17 18854,4 510,22 86533 15524 371,6 6,35
Tentukan model terbaik dengan kriteria best-subsets regression, forward selection dan backward
elimination.
Data 3
Berikut data sampel.
i Y X1 X2 X3 X4 X5 X6
1 443 49 79 76 8 15 205
2 290 27 70 31 6 6 129
3 676 115 92 130 0 9 339
4 536 92 62 92 5 8 247
5 481 67 42 94 16 3 202
6 296 31 54 34 14 11 119
7 453 105 60 47 5 10 212
8 617 114 85 84 17 20 285
9 514 98 72 71 12 -1 242
10 400 15 59 99 15 11 174
11 473 62 62 81 9 1 207
12 157 25 11 7 9 9 45
13 440 45 65 84 19 13 195
14 480 92 75 63 9 20 232
15 316 27 26 82 4 17 134
16 530 111 52 93 11 13 256
17 610 78 102 84 5 7 266
18 617 106 87 82 18 7 276
19 600 97 98 71 12 8 266
20 480 67 65 62 13 12 196
21 279 38 26 44 10 8 110
22 446 56 32 99 16 8 188
23 450 54 100 50 11 15 205
24 335 53 55 60 8 0 170
25 459 61 53 79 6 5 193
26 630 60 108 104 17 8 273
27 483 83 78 71 11 8 233
46
28 617 74 125 66 16 4 265
29 605 89 121 71 8 8 283
30 388 64 30 81 10 10 176
31 351 34 44 65 7 9 143
32 366 71 34 56 8 9 162
33 493 88 30 87 13 0 207
34 648 112 105 123 5 12 340
35 449 57 69 72 5 4 200
36 340 61 35 55 13 0 152
37 292 29 45 47 13 13 123
38 688 82 105 81 20 9 268
39 408 80 55 61 11 1 197
40 461 82 88 54 14 7 225
Tentukan model terbaik dengan kriteria best-subsets regression, forward selection dan backward
elimination.
47
Topik 10 : Analisis Variansi
Analisis variansi digunakan untuk menguji kesamaan tiga rata-rata populasi atau lebih
dengan hipotesis nol 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = ⋯ = 𝜇𝑘 , dan hipotesis alternatif : paling sedikit
ada sepasang rata-rata tidak sama dengan nol (𝐻1 : ∃ 𝜇𝑖 ≠ 𝜇𝑗 , 𝑖 ≠ 𝑖′, 𝑖 = 1, 2, … , 𝑘).
Definisi
Analisis variansi (ANAVA) adalah metode pengujian kesamaan tiga atau lebih rata-rata
populasi dengan analisis variansi sampel.
Gambar 1. Distribusi F
Analisis variansi digunakan pula untuk menganalisis data yang diperoleh dari rancangan
percobaan. Berikut beberapa istilah yang digunakan dalam merancang percobaan.
Definisi
Perlakuan : suatu prosedur atau metode yang diterapkan pada unit percobaan.
Setara dengan taraf dari faktor.
Unit Percobaan : unit terkecil dalam suatu percobaan yang diberi suatu perlakuan.
Unit dimana perlakuan diberikan secara acak.
Satuan Pengamatan : anak gugus dari unit percobaan, tempat dimana respon
perlakuan diukur.
48
Faktor : peubah bebas yang dicobakan dalam percobaan sebagai penyusun struktur
perlakuan.
Taraf : jenis-jenis suatu faktor yang dicobakan dalam percobaan
Tabel A
Variansi antar sampel
𝑛𝑠𝑋2 = 4 0,0833 = 0,3332
Variansi dalam sampel
𝑠12 + 𝑠22 + 𝑠32 3,0 + 2,0 + 2,0
𝑠𝑝2 = = = 2,3333
3 3
Derajat Bebas
Derajat bebas pembilang = k– 1
Derajat bebas penyebut = k(n - 1)
49
Perhitungan analisis variansi untuk ukuran sampel sama
JKT dapat diuraikan menjadi komponen JKP (Jumlah Kuadrat Perlakuan) dan JKG
(Jumlah Kuadrat Galat).
2) JKP (Jumlah Kuadrat Perlakuan), dimaksudkan untuk JK antar sampel, mengukur
variasi antara rata-rata sampel.
2
𝐽𝐾𝑃 = 𝑛𝑗 𝑥𝑗 − 𝑥
3) JKG (Jumlah Kuadrat Galat), dimaksudkan untuk JK (dalam sampel), adalah jumlah
kuadrat yang menunjukkan variasi dalam sampel.
𝐽𝐾𝐺 = 𝑛𝑗 − 1 𝑠𝑗2
Total n–1 𝑥𝑖 − 𝑥 2
50
Contoh
Seorang administrator perguruan tinggi mengklaim bahwa tidak ada perbedaan rata-rata
nilai UAN siswa dari tiga SMA berbeda yang masuk perguruan tinggi tersebut. Data berikut
adalah 15 mahasiswa tahun pertama yang dipilih secara acak dari tiga sekolah tersebut
dengan masing-masing sekolah diambil 5 orang. Apakah pernyataan administrator tersebut
cukup beralasan? Gunakan taraf nyata 0,05.
Hipotesis
H0 : 𝜇1 = 𝜇2 = 𝜇3
H1 : ∃ 𝜇𝑖 ≠ 𝜇𝑗 , 𝑖 ≠ 𝑖′, 𝑖 = 1, 2, 3
Taraf nyata: = 0.05
Statistik Uji:
𝐽𝐾𝑃 𝑘−1
𝐹 = 𝐽𝐾𝐺 𝑛 −𝑘
Kriteria keputusan: k = 3, n = 15; F0,05(2,12) = 3,89
H0 ditolak jika Fhit > 3,89
Hitungan:
0,4545 /2
𝐹 = 1,152 = 2,367
12
51
Kesimpulan:
Karena Fhit = 2,367 < 3,89 maka H0 diterima. Jadi pada taraf nyata 0,05 dapat disimpulkan
bahwa tidak ada perbedaan rata-rata nilai UAN siswa dari tiga SMA berbeda yang masuk
perguruan tinggi tersebut.
SOAL LATIHAN
1. Lima belas siswa kelas XI di suatu sekolah menengah pertama dengan kemampuan
relatif sama telah dipilih secara acak untuk dikelompokkan dalam 3 grup yang
selanjutnya diberikan perlakuan tiga metode mengajar aritmetika yang berbeda.
Pada akhir semester, tes yang sama diberikan kepada lima belas siswa tersebut.
Berikut tabel hasil tes dari siswa tersebut.
Apakah dapat disimpulkan bahwa rata-rata hasil tes siswa dari ketiga metode itu
berbeda? Gunakan taraf nyata 0,05 dan anggap bahwa asumsi-asumsi dalam analisis
variansi terpenuhi.
2. Empat desain sirkuit komputer digital yang berbeda telah diteliti untuk dibandingkan
volume suara yang muncul. Hasil berikut diperoleh:
Desain Sirkuit
Volume suara (dalam dB)
Komputer Digital
1 29; 26; 27; 30
2 36; 34; 33; 35; 30
3 36; 41; 35; 39
4 42; 38; 37; 41; 45
Apakah rata-rata volume suara yang muncul sama untuk semua desain sirkuit
komputer digital? Gunakan α = 0,05. Anggap bahwa asumsi-asumsi dalam analisis
variansi terpenuhi.
52
Rancangan Acak Lengkap (RAL) (Complete Randomized Design)
1 2 1 C 2 A
3 4 3 A 4 B
5 6 5 C 6 B
Tabulasi data
53
Model linier aditif dalam RAL
Model Tetap
Model tetap merupakan model dimana perlakuan-perlakuan yang digunakan dalam
percobaan berasal dari populasi yang terbatas dan pemilihan perlakuan ditentukan
langsung oleh peneliti dan kesimpulan yang diperoleh terbatas hanya pada
perlakuan-perlakuan yang dicobakan saja tidak bisa digeneralisasikan.
Model Acak
Model acak merupakan model dimana perlakuan-perlakuan yang dicobakan
merupakan sampel acak dari populasi perlakuan dan kesimpulan yang diperoleh
berlaku secara umum untuk seluruh populasi perlakuan.
ij ~ N 0, 2
iid
i i
i 1 i 1
a
a a i
a i i , i 1
i 1 i 1 a
sehingga berakibat
a
i 1
i 0
54
Sehingga bentuk hipotesis diatas ekuivalen dengan hipotesis berikut
H0 : 1 2 a 0 (perlakuan tidak berpengaruh terhadap respons yang diamati)
H1 : i 0, i 1, 2,, a
i 1 j 1 i 1 j 1 i 1 j 1
Sehingga
Jumlah Kuadrat Total = Jumlah Kuadrat Perlakuan + Jumlah Kuadrat Galat
JKT = JKP + JKG
r
ar
a i
Yi2 i 1
Yi2
a
JKP FK JKP
i 1
FK
r i 1 ri
a r
JKT Yij2 FK
a r
i 1 j 1
JKT Yij2 FK
i 1 j 1
JKG JKT JKP JKG JKT JKP
55
Tabel Analisis Variansi
Ulangan sama Ulangan tidak sama
SV db JK KT Fhitung SV db JK KT Fhitung
Perlakuan a-1 JKP KTP KTP/KTG Perlakuan a-1 JKP KTP KTP/KTG
Galat a(r-1) JKG KTG Galat (ri -1) JKG KTG
Total ar-1 JKT Total ri -1 JKT
Kriteria keputusan Kriteria keputusan
H0 ditolak jika Fhit > F(a-1, a(r-1)) H0 ditolak jika Fhit > F(a-1, (ri -1))
SOAL LATIHAN
1. Suatu penelitian telah dilakukan untuk mengetahui pengaruh persentase kandungan
paracetamol dalam obat penurun panas terhadap waktu yang diperlukan untuk
menurunkan panas dari 39 menjadi 37. Untuk keperluan ini telah dipilih secara
acak 25 penderita sakit panas dengan suhu 39 dari usia yang hampir sama dan tanpa
keluhan sakit yang lain. Keduapuluh lima pasien tersebut dibagi secara acak menjadi
5 kelompok dan masing-masing kelompok yang terdiri dari 5 orang tersebut diberi
obat penurun panas dengan persentase kandungan paracetamol tertentu. Berikut
data tentang waktu (dalam jam) yang diperlukan oleh para pasien tersebut sampai
dengan panas badan mereka turun menjadi 37 .
KADAR PARACETAMOL
40% 50% 60% 75% 90%
7 9 5 3 2
6 7 4 5 3
9 8 8 2 4
4 6 6 3 1
7 9 3 7 4
56
menjadi 4 kelompok, masing-masing kelompok mendapatkan pembelajaran dengan
salah satu metode tersebut. Dosen yang mengajar di kelas-kelas tersebut telah dipilih
sedemikian hingga dapat dianggap mempunyai karakteristik yang hampir sama.
Setelah pembelajaran selesai, semua kelas mendapat tes dengan soal dan waktu
yang sama. Berikut ini adalah data tentang rata-rata nilai tes mahasiswa dari ke-20
kelas yang digunakan dalam penelitian.
Metode Mengajar
Kelas Tanya Problem Jumlah
Ceramah Diskusi
Jawab Solving
1 8,2 7,0 8,7 6,2 30,1
2 9,2 6,8 7,5 6,8 30,3
3 9,4 5,8 9,3 7,5 32,0
4 7,5 5,3 8,9 5,5 27,2
5 6,2 8,0 7,6 5,7 27,5
Jumlah 40,5 32,9 42 31,7 147,1
57
Rancangan Acak Kelompok Lengkap (RAKL) (Randomized Complete Block Design)
Tabulasi data
Perlakuan
Kelompok Total kelompok (Y•j)
P1 P2 P3 P4 P5 P6
1 Y11 Y21 Y31 Y41 Y51 Y61 Y•1
2 Y12 Y22 Y32 Y42 Y52 Y62 Y•2
3 Y13 Y23 Y33 Y43 Y53 Y63 Y•3
Total Perlakuan (Yi•) Y1• Y2• Y3• Y4• Y5• Y6• Total keseluruhan (Y••)
ij ~ N 0, 2
iid
58
Asumsi untuk model tetap ialah
a b
i 1
i 0 dan
j 1
j 0
a
JKK FK
a
Y 2
i a b
JKP i 1
FK JKT Yij2 FK
b i 1 j 1
59
SOAL LATIHAN
1. Suatu penelitian akan dilakukan untuk membandingkan pengaruh jenis media
pembelajaran yang digunakan guru terhadap hasil belajar siswa kelas 2 SMA khusus
untuk pokok bahasan peluang. Jenis media yang dimaksudkan adalah cetak, audio,
visual dan berbasis komputer. Untuk keperluan tersebut telah dipilih secara acak 12
kelas, namun setelah dilakukan tes kemampuan awal ternyata kelas-kelas tersebut
dapat digolongkan menjadi 3 kelompok (kategori kemampuan awal rendah, kategori
kemampuan awal sedang, kategori kemampuan awal tinggi). Masing-masing
kelompok mendapatkan perlakuan 4 jenis media tersebut. Setelah pembelajaran
selesai, semua kelas mendapat tes dengan soal dan waktu yang sama. Berikut adalah
data tentang rata-rata nilai tes siswa dari keduabelas kelas yang digunakan dalam
penelitian.
Kategori kelas Jenis Media
kemampuan Cetak Audio Visual Berbasis Komputer
awal
Rendah 8,1 6,5 7,4 8,4
Sedang 8,9 6,8 6 7,4
Tinggi 7,7 5,9 5,9 9,4
Jumlah 24,7 19,2 19,3 25,2
Perlakuan 89,1875
Kelompok 4,7292
Galat
Total 111,9375
Lakukan pengujian hipotesis sesuai dengan yang dimaksud gunakan = 0,05 dalam
menyimpulkannya.
60
UJI LANJUT SETELAH ANALISIS VARIANSI
Uji lanjut ini hanya berlaku untuk pengujian model tetap bila hipotesis nol pengaruh
perlakuan ditolak.
Beda Nyata Jujur (BNJ) atau Honest Significant Difference (Tukey test)
• Hipotesis
H0 : μi = μi’
H1 : μi μi’
• Taraf nyata :
• Statistik Uji :
KTG
BNJ q a ,db( g ) a
a 1 r
i 1
i
• Kriteria Keputusan :
H0 ditolak jika Yi Yi ' > BNJ
Uji Perbandingan Berganda Duncan atau Duncan Multiple Range Test (DMRT)
• Hipotesis
H0 : μi = μi’
H1 : μi μi’
• Taraf nyata :
• Statistik Uji :
KTG
R p r p ,db( g ) a
a 1 r
i 1
i
• Kriteria Keputusan :
H0 ditolak jika Yi Yi ' > Rp
61
Contoh
Suatu penelitian telah dilakukan untuk mengetahui pengaruh persentase kandungan
paracetamol dalam obat penurun panas terhadap waktu yang diperlukan untuk menurunkan
panas dari 39 menjadi 37. Untuk keperluan ini telah dipilih secara acak 25 penderita sakit
panas dengan suhu 39 dari usia yang hampir sama dan tanpa keluhan sakit yang lain.
Keduapuluh lima pasien tersebut dibagi secara acak menjadi 5 kelompok dan masing-masing
kelompok yang terdiri dari 5 orang tersebut diberi obat penurun panas dengan persentase
kandungan paracetamol tertentu. Berikut data tentang waktu (dalam jam) yang diperlukan
oleh para pasien tersebut sampai dengan panas badan mereka turun menjadi 37 .
KADAR PARACETAMOL
40% 50% 60% 75% 90%
7 9 5 3 2
6 7 4 5 3
9 8 8 2 4
4 6 6 3 1
7 9 3 7 4
Lakukan uji lanjut setelah Anava bila hipotesis nol pengaruh perlakuan ditolak? Gunakan
taraf nyata 0,05.
62
• Kesimpulan
1=2, 1=3, 3=4, 4=5
14, 15, 25, 23, 24, 35
63
KTG
• Statistik Uji : R p r p ,db( g ) a
a 1 r
i 1
i
p 2 3 4 5
rp 2,95 3,10 3,18 3,25
Rp 2,24 2,35 2,41 2,47
Hitungan :
• Kesimpulan
1=2, 1=3, 3=4, 4=5
14, 15, 25, 23, 24, 35
64
Topik 11 : Asumsi-asumsi dalam Analisis Variansi
Kriteria keputusan:
H0 ditolak jika p-value <
65
Contoh
Seorang peneliti ingin membandingkan tiga merk bola golf dengan melihat jarak bola yang
dipukul oleh teknisi. Dalam hal ini, para teknisi memiliki kemampuan bermain golf yang sama.
Berikut data tentang jarak dalam meter untuk ketiga merk bola golf.
Penyelesaian
66
Kriteria keputusan:
H0 ditolak jika p-value < 0,01
Hitungan:
Kesimpulan:
a) p-value > 0,150 > 0,01 maka H0 diterima
b) p-value > 0,150 > 0,01 maka H0 diterima
c) p-value = 0,046 > 0,01 maka H0 diterima
Jadi pada taraf nyata 0,01 dapat disimpulkan bahwa masing-masing data sampel mengikuti
distribusi normal.
67
Topik 12 : Analisis Variansi Dua Arah
Analisis variansi dua arah merupakan analisis variansi yang digunakan pada rancangan
faktorial. Pengertian dua arah dalam hal ini berkaitan dengan jumlah faktor yang diteliti ada
dua.
Rancangan Faktorial
• Ciri : perlakuan merupakan kombinasi dari semua kemungkinan kombinasi dari taraf-taraf
dua faktor atau lebih.
• Keuntungan adalah mampu mendeteksi respons dari
1. Taraf masing-masing faktor (pengaruh utama)
2. Interaksi antara dua faktor (pengaruh interaksi)
Bila sudah ada dugaan kuat (ada literatur) bahwa faktor A dan faktor B tidak ada interaksi maka tidak
perlu menggunakan rancangan faktorial.
68
Maka kombinasi perlakuan ada 3 × 2 = 6
(A1B1, A1B2, A2B1, A2B2, A3B1, A3B2)
Ulangan ada sebanyak 3
Maka unit percobaan yang diperlukan 3 × 2 × 3 = 18.
7 8 9 A1B1 10 11 12
13 14 15 16 17 18 A1B1
Tabulasi Data
Ulangan A1 A2 A3 Total
B1 1 Y111 Y211 Y311
2 Y112 Y212 Y312
3 Y113 Y213 Y313
Total Y11• Y21• Y31• Y•1•
B2 1 Y121 Y221 Y321
2 Y122 Y222 Y322
3 Y123 Y223 Y323
Total Y12• Y22• Y32• Y•2•
Total Y1•• Y2•• Y3•• Y•••
69
Asumsi untuk model acak ialah
iid iid iid
α i ~ N (0, σ α2 ), β j ~ N (0, σ β2 ), (αβ )ij ~ N (0, σ αβ
2
)
Model Tetap (Faktor A dan B tetap)
70
Model Campuran (Faktor A tetap dan B acak)
71
Perhitungan Analisis Variansi
b
Y2
FK = ••• ∑Y 2
• j•
abr JKB =
j =1
− FK
a b ar
∑∑ Y
i =1 j =1
2
ij •
a b
JKT = ∑∑∑ Yijk2 − FK
r
JKP = − FK i =1 j =1 k =1
r JKAB = JKP − JKA − JKB
a
∑Y
i =1
2
i ••
JKG = JKT − JKP
JKA = − FK
br
SOAL LATIHAN
1. Suatu penelitian telah dilakukan untuk mengetahui pengaruh jenis pupuk dan varietas padi
terhadap hasil produksi padi. Jenis pupuk yang diteliti adalah P1, P2, P3 dan P4. Dari berbagai
varietas padi yang ada, telah dipilih secara acak 3 diantaranya yaitu V1, V2 dan V3.
Mengingat terbatasnya lahan, ulangan hanya dilakukan sebanyak 3 kali untuk setiap
kombinasi perlakuannya. Percobaan dilakukan di sawah percobaan, dengan kondisi tanah,
pengairan dan penyinaran dapat dianggap relatif homogen, sehingga pengacakan secara
lengkap dapat diterapkan pada petak-petak percobaan. Berikut ini adalah data hasil produksi
padi untuk setiap petak percobaan, yang dicatat dalam kuintal.
Analisislah data tersebut sesuai maksud penelitiannya. Gunakan taraf nyata 0,05. Anggap
asumsi-asumsi dalam Anava terpenuhi
72
58 57 53
P4 41 61 59
46 53 38
Jumlah
Total
Perhatikan berikut !
A : jenis pupuk
B : varietas padi
a = 4, b = 3, r = 3
Sumber Keragaman Derajat Bebas
A a-1 = (a) – (1)
B b-1 = (b) – (1)
AB (a-1)(b-1) = (ab) – (a) – (b) +(1)
Galat ab(r-1) = (abr) – (ab)
Total abr-1 = (abr) – (1)
2 2 2 2
(a ) → a1 +a +a +a
2 3 4
br
2
+ b22 + b32
(b ) → b1
ar
2 2 2 2 2 2 2 2 2 2 2 2
(ab ) → ab11 + ab12 + ab13 + ab21 + ab22 + ab23 + ab31 + ab32 + ab33 + ab41 + ab42 + ab43
r
(abr ) → ∑∑∑
Yijk2
1
Y•2••
(1) →
abr
2. Sebuah percobaan telah dilakukan untuk mengetahui pengaruh diabetes dan berat badan
terhadap tekanan darah diastolik. Berikut data tekanan darah diastolik (dalam mmHg) dari 20
peserta.
Apakah ada pengaruh interaksi antara diabetes dan berat badan terhadap tekanan darah
diastolik? Gunakan taraf nyata 0,05.
73
3. Sebuah penelitian telah dilakukan untuk mengetahui pengaruh televisi dan internet terhadap
hasil prestasi mahasiswa. Berikut data nilai IPK sebagai peubah respons.
Waktu penggunaan internet Waktu menonton televisi
Sedikit Lama
Sedikit 3,9; 4,0; 3,5 2,7; 2,5; 2,8
Lama 3,5; 3,3; 3,0 2,0; 2,4; 2,3
a) Buatlah tabel analisis variansi dua arah.
b) Buatlah gambar pengaruh interaksi televisi dan internet, interpretasikan.
74
TABEL
4
Appendix A
Table A-1
Models with an intercept (from Savin and White)
k’*=11 k’=12 k’=13 k’=14 k’=15 k’=16 k’=17 k’=18 k’=19 k’=20
n dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU
16 0.060 3.446 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
17 0.084 3.286 0.053 3.506 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
18 0.113 3.146 0.075 3.358 0.047 3.557 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
19 0.145 3.023 0.102 3.227 0.067 3.420 0.043 3.601 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
20 0.178 2.914 0.131 3.109 0.092 3.297 0.061 3.474 0.038 3.639 ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
21 0.212 2.817 0.162 3.004 0.119 3.185 0.084 3.358 0.055 3.521 0.035 3.671 ----- ----- ----- ----- ----- ----- ----- -----
22 0.246 2.729 0.194 2.909 0.148 3.084 0.109 3.252 0.077 3.412 0.050 3.562 0.032 3.700 ----- ----- ----- ----- ----- -----
23 0.281 2.651 0.227 2.822 0.178 2.991 0.136 3.155 0.100 3.311 0.070 3.459 0.046 3.597 0.029 3.725 ----- ----- ----- -----
24 0.315 2.580 0.260 2.744 0.209 2.906 0.165 3.065 0.125 3.218 0.092 3.363 0.065 3.501 0.043 3.629 0.027 3.747 ----- -----
25 0.348 2.517 0.292 2.674 0.240 2.829 0.194 2.982 0.152 3.131 0.116 3.274 0.085 3.410 0.060 3.538 0.039 3.657 0.025 3.766
26 0.381 2.460 0.324 2.610 0.272 2.758 0.224 2.906 0.180 3.050 0.141 3.191 0.107 3.325 0.079 3.452 0.055 3.572 0.036 3.682
27 0.413 2.409 0.356 2.552 0.303 2.694 0.253 2.836 0.208 2.976 0.167 3.113 0.131 3.245 0.100 3.371 0.073 3.490 0.051 3.602
28 0.444 2.363 0.387 2.499 0.333 2.635 0.283 2.772 0.237 2.907 0.194 3.040 0.156 3.169 0.122 3.294 0.093 3.412 0.068 3.524
29 0.474 2.321 0.417 2.451 0.363 2.582 0.313 2.713 0.266 2.843 0.222 2.972 0.182 3.098 0.146 3.220 0.114 3.338 0.087 3.450
30 0.503 2.283 0.447 2.407 0.393 2.533 0.342 2.659 0.294 2.785 0.249 2.909 0.208 3.032 0.171 3.152 0.137 3.267 0.107 3.379
31 0.531 2.248 0.475 2.367 0.422 2.487 0.371 2.609 0.322 2.730 0.277 2.851 0.234 2.970 0.193 3.087 0.160 3.201 0.128 3.311
32 0.558 2.216 0.503 2.330 0.450 2.446 0.399 2.563 0.350 2.680 0.304 2.797 0.261 2.912 0.221 3.026 0.184 3.137 0.151 3.246
33 0.585 2.187 0.530 2.296 0.477 2.408 0.426 2.520 0.377 2.633 0.331 2.746 0.287 2.858 0.246 2.969 0.209 3.078 0.174 3.184
34 0.610 2.160 0.556 2.266 0.503 2.373 0.452 2.481 0.404 2.590 0.357 2.699 0.313 2.808 0.272 2.915 0.233 3.022 0.197 3.126
35 0.634 2.136 0.581 2.237 0.529 2.340 0.478 2.444 0.430 2.550 0.383 2.655 0.339 2.761 0.297 2.865 0.257 2.969 0.221 3.071
36 0.658 2.113 0.605 2.210 0.554 2.310 0.504 2.410 0.455 2.512 0.409 2.614 0.364 2.717 0.322 2.818 0.282 2.919 0.244 3.019
37 0.680 2.092 0.628 2.186 0.578 2.282 0.528 2.379 0.480 2.477 0.434 2.576 0.389 2.675 0.347 2.774 0.306 2.872 0.268 2.969
38 0.702 2.073 0.651 2.164 0.601 2.256 0.552 2.350 0.504 2.445 0.458 2.540 0.414 2.637 0.371 2.733 0.330 2.828 0.291 2.923
39 0.723 2.055 0.673 2.143 0.623 2.232 0.575 2.323 0.528 2.414 0.482 2.507 0.438 2.600 0.395 2.694 0.354 2.787 0.315 2.879
40 0.744 2.039 0.694 2.123 0.645 2.210 0.597 2.297 0.551 2.386 0.505 2.476 0.461 2.566 0.418 2.657 0.377 2.748 0.338 2.838
45 0.835 1.972 0.790 2.044 0.744 2.118 0.700 2.193 0.655 2.269 0.612 2.346 0.570 2.424 0.528 2.503 0.488 2.582 0.448 2.661
50 0.913 1.925 0.871 1.987 0.829 2.051 0.787 2.116 0.746 2.182 0.705 2.250 0.665 2.318 0.625 2.387 0.586 2.456 0.548 2.526
55 0.979 1.891 0.940 1.945 0.902 2.002 0.863 2.059 0.825 2.117 0.786 2.176 0.748 2.237 0.711 2.298 0.674 2.359 0.637 2.421
60 1.037 1.865 1.001 1.914 0.965 1.964 0.929 2.015 0.893 2.067 0.857 2.120 0.822 2.173 0.786 2.227 0.751 2.283 0.716 2.338
65 1.087 1.845 1.053 1.889 1.020 1.934 0.986 1.980 0.953 2.027 0.919 2.075 0.886 2.123 0.852 2.172 0.819 2.221 0.789 2.272
70 1.131 1.831 1.099 1.870 1.068 1.911 1.037 1.953 1.005 1.995 0.974 2.038 0.943 2.082 0.911 2.127 0.880 2.172 0.849 2.217
75 1.170 1.819 1.141 1.856 1.111 1.893 1.082 1.931 1.052 1.970 1.023 2.009 0.993 2.049 0.964 2.090 0.934 2.131 0.905 2.172
80 1.205 1.810 1.177 1.844 1.150 1.878 1.122 1.913 1.094 1.949 1.066 1.984 1.039 2.022 1.011 2.059 0.983 2.097 0.955 2.135
85 1.236 1.803 1.210 1.834 1.184 1.866 1.158 1.898 1.132 1.931 1.106 1.965 1.080 1.999 1.053 2.033 1.027 2.068 1.000 2.104
90 1.264 1.798 1.240 1.827 1.215 1.856 1.191 1.886 1.166 1.917 1.141 1.948 1.116 1.979 1.091 2.012 1.066 2.044 1.041 2.077
95 1.290 1.793 1.267 1.821 1.244 1.848 1.221 1.876 1.197 1.905 1.174 1.943 1.150 1.963 1.126 1.993 1.102 2.023 1.079 2.054
100 1.314 1.790 1.292 1.816 1.270 1.841 1.248 1.868 1.225 1.895 1.203 1.922 1.181 1.949 1.158 1.977 1.136 2.006 1.113 2.034
150 1.473 1.783 1.458 1.799 1.444 1.814 1.429 1.830 1.414 1.847 1.400 1.863 1.385 1.880 1.370 1.897 1.355 1.913 1.340 1.931
200 1.561 1.791 1.550 1.801 1.539 1.813 1.528 1.824 1.518 1.836 1.507 1.847 1.495 1.860 1.484 1.871 1.474 1.883 1.462 1.896
*k’ is the number of regressors excluding the intercept
6
Appendix A
Table A-2
Models with an intercept (from Savin and White)
k’*=11 k’=12 k’=13 k’=14 k’=15 k’=16 k’=17 k’=18 k’=19 k’=20
n dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU
16 0.098 3.503 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
17 0.138 3.378 0.087 3.557 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
18 0.177 3.265 0.123 3.441 0.078 3.603 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
19 0.220 3.159 0.160 3.335 0.111 3.496 0.070 3.642 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
20 0.263 3.063 0.200 3.234 0.145 3.395 0.100 3.542 0.063 3.676 ----- ----- ----- ----- ----- ----- ----- ----- ----- -----
21 0.307 2.976 0.240 3.141 0.182 3.300 0.132 3.448 0.091 3.583 0.058 3.705 ----- ----- ----- ----- ----- ----- ----- -----
22 0.349 2.897 0.281 3.057 0.220 3.211 0.166 3.358 0.120 3.495 0.083 3.619 0.052 3.731 ----- ----- ----- ----- ----- -----
23 0.391 2.826 0.322 2.979 0.259 3.128 0.202 3.272 0.153 3.409 0.110 3.535 0.076 3.650 0.048 3.753 ----- ----- ----- -----
24 0.431 2.761 0.362 2.908 0.297 3.053 0.239 3.193 0.186 3.327 0.141 3.454 0.101 3.572 0.070 3.678 0.044 3.773 ----- -----
25 0.470 2.702 0.400 2.844 0.335 2.983 0.275 3.119 0.221 3.251 0.172 3.376 0.130 3.494 0.094 3.604 0.065 3.702 0.041 3.790
26 0.508 2.649 0.438 2.784 0.373 2.919 0.312 3.051 0.256 3.179 0.205 3.303 0.160 3.420 0.120 3.531 0.087 3.632 0.060 3.724
27 0.544 2.600 0.475 2.730 0.409 2.859 0.348 2.987 0.291 3.112 0.238 3.233 0.191 3.349 0.149 3.460 0.112 3.563 0.081 3.658
28 0.578 2.555 0.510 2.680 0.445 2.805 0.383 2.928 0.325 3.050 0.271 3.168 0.222 3.283 0.178 3.392 0.138 3.495 0.104 3.592
29 0.612 2.515 0.544 2.634 0.479 2.755 0.418 2.874 0.359 2.992 0.305 3.107 0.254 3.219 0.208 3.327 0.166 3.431 0.129 3.528
30 0.643 2.477 0.577 2.592 0.512 2.708 0.451 2.823 0.392 2.937 0.337 3.050 0.286 3.160 0.238 3.266 0.195 3.368 0.156 3.465
31 0.674 2.443 0.608 2.553 0.545 2.665 0.484 2.776 0.425 2.887 0.370 2.996 0.317 3.103 0.269 3.208 0.224 3.309 0.183 3.406
32 0.703 2.411 0.638 2.517 0.576 2.625 0.515 2.733 0.457 2.840 0.401 2.946 0.349 3.050 0.299 3.153 0.253 3.252 0.211 3.348
33 0.731 2.382 0.668 2.484 0.606 2.588 0.546 2.692 0.488 2.796 0.432 2.899 0.379 3.000 0.329 3.100 0.283 3.198 0.239 3.293
34 0.758 2.355 0.695 2.454 0.634 2.554 0.575 2.654 0.518 2.754 0.462 2.854 0.409 2.954 0.359 3.051 0.312 3.147 0.267 3.240
35 0.783 2.330 0.722 2.425 0.662 2.521 0.604 2.619 0.547 2.716 0.492 2.813 0.439 2.910 0.388 3.005 0.340 3.099 0.295 3.190
36 0.808 2.306 0.748 2.398 0.689 2.492 0.631 2.586 0.575 2.680 0.520 2.774 0.467 2.868 0.417 2.961 0.369 3.053 0.323 3.142
37 0.831 2.285 0.772 2.374 0.714 2.464 0.657 2.555 0.602 2.646 0.548 2.738 0.495 2.829 0.445 2.920 0.397 3.009 0.351 3.097
38 0.854 2.265 0.796 2.351 0.739 2.438 0.683 2.526 0.628 2.614 0.575 2.703 0.522 2.792 0.472 2.880 0.424 2.968 0.378 3.054
39 0.875 2.246 0.819 2.329 0.763 2.413 0.707 2.499 0.653 2.585 0.600 2.671 0.549 2.757 0.499 2.843 0.451 2.929 0.404 3.013
40 0.896 2.228 0.840 2.309 0.785 2.391 0.731 2.473 0.678 2.557 0.626 2.641 0.575 2.724 0.525 2.808 0.477 2.829 0.430 2.974
45 0.988 2.156 0.938 2.225 0.887 2.296 0.838 2.367 0.788 2.439 0.740 2.512 0.692 2.586 0.644 2.659 0.598 2.733 0.553 2.807
50 1.064 2.103 1.019 2.163 0.973 2.225 0.927 2.287 0.882 2.350 0.836 2.414 0.792 2.479 0.747 2.544 0.703 2.610 0.660 2.675
55 1.129 2.062 1.087 2.116 1.045 2.170 1.003 2.225 0.961 2.281 0.919 2.338 0.877 2.396 0.836 2.454 0.795 2.512 0.754 2.571
60 1.184 2.031 1.145 2.079 1.106 2.127 1.068 2.177 1.029 2.227 0.990 2.278 0.951 2.330 0.913 2.382 0.874 2.434 0.836 2.487
65 1.231 2.006 1.195 2.049 1.160 2.093 1.124 2.138 1.088 2.183 1.052 2.229 1.016 2.276 0.980 2.323 0.944 2.371 0.908 2.419
70 1.272 1.987 1.239 2.026 1.206 2.066 1.172 2.106 1.139 2.148 1.105 2.189 1.072 2.232 1.038 2.275 1.005 2.318 0.971 2.362
75 1.308 1.970 1.277 2.006 1.247 2.043 1.215 2.080 1.184 2.118 1.153 2.156 1.121 2.195 1.090 2.235 1.058 2.275 1.027 2.315
80 1.340 1.957 1.311 1.991 1.283 2.024 1.253 2.059 1.224 2.093 1.195 2.129 1.165 2.165 1.136 2.201 1.106 2.238 1.076 2.275
85 1.369 1.946 1.342 1.977 1.315 2.009 1.287 2.040 1.260 2.073 1.232 2.105 1.205 2.139 1.177 2.172 1.149 2.206 1.121 2.241
90 1.395 1.937 1.369 1.966 1.344 1.995 1.318 2.025 1.292 2.055 1.266 2.085 1.240 2.116 1.213 2.148 1.187 2.179 1.160 2.211
95 1.418 1.930 1.394 1.956 1.370 1.984 1.345 2.012 1.321 2.040 1.296 2.068 1.271 2.097 1.247 2.126 1.222 2.156 1.197 2.186
100 1.439 1.923 1.416 1.948 1.393 1.974 1.371 2.000 1.347 2.026 1.324 2.053 1.301 2.080 1.277 2.108 1.253 2.135 1.229 2.164
150 1.579 1.892 1.564 1.908 1.550 1.924 1.535 1.940 1.519 1.956 1.504 1.972 1.489 1.989 1.474 2.006 1.458 2.023 1.443 2.040
200 1.654 1.885 1.643 1.896 1.632 1.908 1.621 1.919 1.610 1.931 1.599 1.943 1.588 1.955 1.576 1.967 1.565 1.979 1.554 1.991
*K’ is the number of regressors excluding the intercept