Anda di halaman 1dari 9

14.

3 Mengevaluasi Persamaan Regresi Berganda

Banyak statistika dan metode statistik yang digunakan untuk menilai hubungan antara variabel
terikat dengan lebih dari satu variabel bebas. Langkah awal yang dilakukan adalah menuliskan
hubungan antarvariabel tersebut dalam bentuk persamaan regresi berganda. Langkah berikutnya
mengikuti konsep yang disajikan dalam Bab 13 melalui informasi pada tabel ANOVA untuk
menilai tingkat kesesuaian antara persamaan tersebut dengan data yang sama.

Tabel ANOVA

Analisis statistik persamaan regresi berganda dirangkum dalam tabel ANOVA. Total variabel
terikat Y, terbagi menjadi dua komponen: (1) regresi, atau variasi Y yang dijelaskan oleh seluruh
variabel bebas dan (2) kesalahan atau residu, atau variasi yang tidak dijelaskan oleh Y. Kedua
kategori tersebut diketahui pada kolom pertama tabel ANOVA dibawah ini. Kolom berjudul “df”
mengacu pada derajat kebebasan yang terkait dengan setiap kategori. Total jumlah derajat
kebebasan adalah n – 1. Jumlah derajat kebebasan regresi sama dengan jumlah variabel bebas di
dalam persamaan regresi berganda. Derajat kebebasan regresi diberi lambang k. Jumlah derajat
kebebasan terkait dengan komponen kesalahan yang sama dengan total derajat kebebasan
dikurangi derajat kebebasan regresi. Di dalam regresi berganda, derajat kebebasannya adalah n –
(k + 1).

Istilah “SS” yang terletak di tengah-tengah tabel ANOVA mengacu pada jumlah
kuadratnya. Perhatikan bahwa terdapat penjumlahan kuadrat untuk setiap sumber variasinya.
Kolom jumlah kuadrat menunjukkan jumlah variasi yang melekat pada masing-masing
sumbernya. Total variasi variabel terikat Y diringkas dalam SS total. SS total hanyalah pembilang
dari persamaan yang bisa digunakan untuk menghitung segala jenis variasi, dengan kata lain
jumlah kuadrat deviasi rata-ratanya. Cara menghitung nilai SS total adalah :
Total dari jumlah kuadrat merupakan penjumlahan dari jumlah kuadrat residu dan regresi. Jumlah
kuadrat regresi merupakan penjumlahan kuadrat dari selisih antara nilai perkiraan Ŷ, dengan
keseluruhan rata-rata Y. Jumlah kuadrat regresi diperoleh dari persamaan :

Jumah kuadrat regresi merupakan penjumlahan kuadrat dari selisih antara nilai variabel terikat
yang diamati Y, dengan nilai perkiraan atau taksirannya yang sesuai, Ŷ. Perhatikan bahwa
selisihnya merupakan nilai kesalahan perkiraan atau peramalan variabel terikat dalam persamaan
regresi berganda. Nilainya dihitung dengan persamaan :

Akan digunkan informasi pada tabel ANOVA dari contoh sebelumnya untuk mengevaluasi
persamaan regresi agar diperoleh perkiraan biaya pemanas di bulan Januari

Kesalahan Standar Estimasi Berganda

Kesalahan standar estimasi dapat disejajarkan dengan standar deviasi. Sebagai penjelasan rinci
mengenai kesalahan standar estimasi, lihat sampel rumah pertama dalam tabel 14-1 pada contoh
sebelumnya. Biaya pemanas aktual pada pengamatan pertama, Y, adalah $250, suhu luar ruangan,
X1, adalah 35 derajat, ketebalan sekat, X2, adalah 3 inci, dan usia perapian, X3, adalah 6 tahun.
Menggunakan persamaan regresi yang dijabarkan pada bagian sebelumnya, perkiraan biaya
pemanas untuk rumah tersebut adalah:

Dengan persamaan ini, diperkirakan bahwa rumah dengan suhu luar ruangan di bulan Januari 35
derajat, sekat 3 inci, dan perapian berusia 6 tahun akan memerlukan biaya pemanas sebesar
$258,90. Dengan mengetahui bahwa biaya pemanas aktual sebesar $250, maka diperoleh nilai
residu yang merupakan selisih antara nilai aktual dan nilai perkiraannya sebesar Y – Ŷ = 250 –
258,90 = -8,90. Selisih nilai sebesar $8,90 ini merupakan kesalahan acak atau yang tidak dapat
dijelaskan pada sampel rumah pertama. Langkah selanjutnya adalah menguadratkan selisihnya,
yakni (Y – Ŷ)2 = (250-258,90)2 = (-8,90)2 = 79,21.

Jika perhitungan tersebut diulangi untuk 19 pengamatan lainnya dan seluruh kuadrat
selisihnya yang berjumlah 20 dijumlahkan, totalnya akan berupa jumlah kuadrat residu atau
kesalahan dari tabel ANOVA. Melalui informasi ini dapat dihitung kesalahan standar estimasi
berganda dengan persamaan sebagai berikut

Keterangan :

 Y = pengamatan aktual
 Ŷ = nilai perkiraan yang dihiutng melalui persamaan regresi
 n = jumlah pengamatan dalam sampel
 k = jumlah variabel bebas
 SSR = jumlah kuadrat residu dari tabel ANOVA

kolom berikutnya yang perlu ditambahkan dalam tabel ANOVA diberi nama MS, atau
kuadrat rata-rata. Pada sumber variasi regresi dan residu, kuadrat rata-ratanya dihitung dari jumlah
kuadratnya dibagi dengan derajat kebebasan yang sesuai. Pada kasus kesalahan standar rata-rata
berganda, kesalahan standar estimasi berganda merupakan akar kuadrat dari kuadrat rata-rata
residunya.

Bagaimana mengartikan nilai kesalahan standar estimasi sebesar 51,05? Nilai ini
merupakan “kesalahan” umum ketika kita menggunakan persamaan tersebut untuk menaksir
biayanya. Pertama, satuan variabel terikatnya sama, sehingga kesalan standarnya dalam dolar
adalah $51,05. Kedua, diperkirakan bahwa residunya terdistribusi secara nromal, sehingga sekitar
68 persen residunya akan berada pada ±$51,05 dan sekitar 95 persennya pada ±2(%51,05) atau
±$102,10. Kesalahan standar berganda yang lebih kecil menunjukkan persamaan taksiran yang
lebih baik atau lebih efektif.

Koefisien Determinasi Berganda

Koefisien determinasi diartikan sebagai persen variasi variabel terikat yang dijelaskan atau
diperhitungkan oleh variabel bebas. Dalam kasus regresi berganda, pengertiannya diperluas
sebagai berikut.

Ciri-ciri koefisien determinasi berganda antara lain:

1. Dilambangkan dengan huruf kapital R2, karena berperilaku seperti koefisien korelasi
kuadrat
2. Berkisar dari 0 hingga 1. Nilai yang mendekati 0 menunjukkan hubungan lemah antara
sekelompok variabel bebas dengan variabel terikatnya. Nilai mendekati 1 menunjukkan
hubungan yang kuat.
3. Tidak dapat bernilai negatif. Sembarang angka yang dikuadratkan tidak bisa berniali
negatif
4. Mudah untuk ditafsirkan. Karena R2 merupakan nilai di antara 0 dan 1, maka mudah untuk
ditafsirkan, dibandingkan, dan dipahami.
Koefisien determinasi dapat dihitung melalui informasi yang diperoleh pada tabel ANOVA. Amati
kolom jumlah kuadratnya yang diberi nama SS pada keluaran Excel, dan gunakan jumlah kuadrat
regresi, SSR, lalu bagi dengan total jumlah kuadrat, SS total.

Menggunakan kuadrat jumlah residu dan totalnya dari tabel ANOVA, kita dapat
menggunakan persamaan (14-3) untuk menghitung koefisien determinasi bergandanya.

Disimpulkan bahwa variabel bebasnya (suhu luar ruangan, jumlah sekat, dan usia perapian)
menunjukkan 80,4 persen variasi biaya pemanas. Dengan kata lain, 19,6 persen variasinya adalah
akibat dari sumber-sumber lain, misalnya kesalahan acak atau variabel yang tidak termasuk di
dalam analisis. Dari tabel ANOVA, nilai 19,6 persen merupakan jumlah kuadrat kesalahan dibagi
dengan total jumlah kuadratnya. Mengingat bahwa SSR + SSE = SS total, hubungan pada
persamaan berikut ini adalah benar.

Koefisien Determinasi yang Disesuaikan

Jumlah variabel bebas pada persamaan regresi berganda membuat joefisien determinasi membesar.
Setiap variabel bebas baru menyebabkan taksirannya lebih akurat. Yakni, pada gilirannya
membuat SSE mengecil dan SSR membesar. Oleh karena itu, nilai R2 yang meningkat hanya
karena total jumlah variabel bebas dan bukan karena tambahan variabel bebas merupakan penaksir
yang baik atas variabel terikat. Faktanya jika jumlah variabel (k) dan ukuran sampel (n) bernilai
sama, koefisien determinasinya adalah 1,0. Praktiknya, situasi ini langka dan juga akan
dipertanyakan secara etis. Guna mengimbangi pengaruh bahwa jumlah variabel bebas memiliki
koefisien determinasi berganda, paket perangkat lunak statistik menggunakan koefisien
determinasi berganda yang disesuaikan (adjusted).
Kesalahan dan total kuadrat kesalahan dibagi dengan derajat kebebasannya. Perhatikan terutama
pada derajat kebebasan untuk kesalahan jumlah kuadrat yang melibatkan k (jumlah variabel
bebas). Pada contoh biaya pemanas, koefisien determinasi yang disesuaikan adalah:

Jika R2 (0,80) dibandingkan dengan R2 yang disesuaikan (0,77), selisihnya pada kasus ini sedikit.
14.7 Model Regresi dengan Interaksi

Pada Bab 12, kita membahas interaksi antarvariabel bebas. Sebagai penjelasan, asumsikan kita
sedang mempelajari penurunan berat badan dan mengasumsikan seperti yang ditunjukkan oleh
berbagai buku akhir-akhir ini bahwa diet dan latihan salingberkaitan. Oleh karena itu, variabel
terikatnya adalah jumlah perubahan berat badan dan variabel bebasnya adalah: diet (ya atau tidak)
dan latihan (tidak, jarang. sering). Kita mengamati apakah terdapat interaksi antarvariabel
bebasnya. Yakni, jika studi tersebut mempertahankan diet dan latihannya secara signifikan,
akankah jumlah rata-rata penurunan berat badan meningkat? Apakah total penurunan berat badan
melebihi jumlah dari penurunan berat badan akibat pengaruh diet dan pengaruh latihan?

Kita dapat mengembangkan gagasan ini. Di samping memiliki dua variabel berskala nominal, diet
dan latihan, kita dapat menyelidiki pengaruh (interaksi) dari beberapa variabel berskala rasio.
Sebagai contoh, andaikan kita ingin mempelajari pengaruh suhu ruangan (68, 72, 76, atau 80
derajat Fahrenheit) dan tingkat kebisingan (60, 70, atau 80 desibel) terhadap jumlah barang yang
diproduksi. Dengan kata lain, apakah kombinasi dari tingkat kebisingan di dalam ruangan dan suhu
ruangan memiliki pengaruh terhadap produktivitas pekerja? Akankah para pekerja di dalam
ruangan yang tenang dan dingin menghasilkan lebih banyak barang dibandingkan dengan pekerja
yang bekerja di dalam ruangan yang panas dan bising?

Dalam analisis regresi, interaksi dapat diselidiki sebagai variabel bebas yang terpisah. Variabel
taksiran interaksi dapat dijabarkan dengan mengalikan nilai data pada suatu variabel bebas dengan
nilai variabel bebas lainnya, sehingga diperoleh variabel bebas baru. Model dua variabel yang
memasukkan komponen interaksi yakni:

Y = α + β1X1 + β2X2 + β3X1 X2


Komponen X1,X2 merupakan komponen interaksi. Kita membentuk variabel ini dengan
mengalikan nilai X1, dan X2, untuk membuat variabel bebas ketiga. Kemudian kia menjabarkan
persamaan regresinya melalui tiga variabel bebas dan menguji signifikansi variabel bebas ketiga
melalui uji individu untuk variabel bebas yang digambarkan sebelumnya pada bab ini. Contoh
berikut akan memberikan gambaran yang lebih jelas.

Informasi
dari Tabel
14-1 bagi
variabel
bebas suhu
dan sekat
diulangi
sebagai
berikut.

Kita

membentuk variabel interaksinya dengan mengalikan variabel suhu dengan sekat. Untuk sampel
rumah pertama, nilai suhunya adalah 35 derajat dan sekatnya adalah 3 inci, sehingga nilai variabel
interaksinya sebesar 35 x 3=105. Nilai perkalian interuksi lainnya diperoleh dengan cara yang
sama.

Kita menemukan regresi bergandanya menggunakan suhu, sekat dan interaksi suhu dan sekatnya
sebagai variabel bebas. Persamaan regresinya dibawah ini.

Y = 598, 070 – 7,811X1 – 30,161X2 + 0,385X1 X2

Pertanyaan yang ingin kita jawab adalah apakah variabel interaksinya signifikan. Kita akan
menggambarkan tingkat signifikan 0,05 dalam bentuk hipotesis.

H0 = β4 = 0

H0 = β4 ≠ 0
Terdapat n-(k+1) = 20-(3+1) = derajat kebebasan 16. Melalui tingkat signifikan 0,05 dan uji dua
sisi, nilai kritis adalah -2,120 dan 2,120. Kita menolak hipotesis nol jika t kurang dari -2,120 atau
lebih besar dari 2,120. Untuk menemukan nilai t dengan menggunakan rumus.
𝑏 −0 0,385−0
t = 𝑆3 = = 1,324
𝑏3 0,291

Oleh karena itu nilai hitung 1,324 kurang dari nilai kritis 2,120. Kita tidak menolak hipotesis
nolnya. Kita menyimpulkan bahwa tidak terdapat interaksi signifikan antara suhu dengan sekat.

Terdapat situasi lain yang dapat lerjadi ketika mempelajari interaksi di antara variabel bebasnya.

1. Dimungkinkan untuk memiliki interaksi tiga arah di antara variabel bebasnya. Pada contoh
pemanas, kita telah mempertimbangkan interaksi tiga arah di antara suhu, sekat, dan usia
perapian.

2. Dimungkinkan untuk memiliki interaksi dengan salah satu dari variabel bebasnya berskala
nominal. Pada contoh biaya pemanas, telah mempelajari interaksi antara suhu dengan
garasi.

Mempelajari seluruh kemungkinan interaksi bisa jadi sangatlah rumit. Akan tetapi, pertimbangan
yang teliti mengenai kemungkinan interaksi antarvariabel bebasnya sering mampu memberikan
pemahaman ke dalam model regresinya.

Anda mungkin juga menyukai