Model matematika untuk regresi linier dengan dua variabel independen adalah
Y = 0 + 1X1 + 2X2 + (3.3)
dimana Y adalah variabel dependen, X1 dan X2 adalah variabel-variabel independen,
adalah sesatan acak, dan 0, 1 dan 2 adalah parameter populasi yang nilainya tidak
diketahui. Sesatan acak diasumsikan mempunyai mean 0 dan variansi 2.
Jika b0, b1 dan b2 masing-masing adalah estimator untuk 0, 1 dan 2 maka
(3.6)
(3.7)
dan
(3.8)
dimana
dan
Perhatikan bahwa pada rumus (3.6) dan (3.7) kita menggunakan huruf kecil yang artinya
berbeda dengan penggunaan huruf besar, yakni
, , dan .
Jika nilai-nilai b0, b1 dan b2 telah diperoleh maka persamaan garis regresi yang
merupakana estimasi hubungan antara variabel-variabel X1, X2 dan variabel Y adalah
(3.9)
Berikut ini adalah contoh perhitungan estimator b0, b1, dan b2 didasarkan pada data
simulasi.
Contoh 3.1
Anggap seorang peneliti meyakini ada hubungan linier antara tingkat IQ dan
motivasi terhadap nilai mahasiswa. Tingkat IQ dianggap sebagai variabel independen
pertama (X1), motivasi dianggap sebagai variabel independen kedua (X2), dan nilai
mahasiswa dianggap sebagai variabel dependen (Y). Anggap data sampel yang tersedia
dari responden sebanyak 10 mahasiswa adalah sebagai berikut:
Tabel 3.2 Data simulasi tingkat IQ, motivasi, dan nilai mahasiswa.
Untuk menghitung estimator b0, b1, dan b2 dengan bantuan rumus (3.10)-(3.14)
kita siapkan tabel sebagai berikut:
Tabel 3.3 Tabel untuk menghitung b0, b1 dan b2 dengan bantuan rumus (3.10)-(3.14)
dan
3.3.2 Mengestimasi 2
Setelah nilai-nilai b0, b1 dan b2 diperoleh maka kita dapat mengestimasi hubungan
antara variabel independen X1, X2, dan variabel dependen Y dengan persamaan regresi
(3.21)
Jika rumus ini digunakan untuk memprediksi nilai Y dengan menggunkan data-data X1
dan X2 yang kita miliki, maka akan diperoleh residual-residual, yakni
Residual-residual e1, e2, ..., en ini selanjutnya dapat digunakan untuk mengestimasi
variansi sesatan (2) dengan rumus
(3.22)
Hasil perhitungan selengkapnya beserta kuadrat residu disajikan pada Tabel 3.7.
Langkah 2. Klik menu Analyze, sorot Regression, lalu pilih Linear, maka akan muncul
kotak dialog Linear Regression. Masukkan variabel IQ dan Motivasi ke kotak
Independent(s) dan variabel Nilai ke kotak Dependent sehingga diperoleh tampilan
sebagai berikut:
Langkah 3. Pada kotak dialog Linear Regression klik Statistics. Check list ( )
Estimates untuk memunculkan nilai-nilai estimator. Check list ( ) Confidence
intervals untuk memunculkan interval konfidensi. Check list ( ) Model fit untuk
memunculkan tabel Anova, lalu klik Continue. Selanjutnya klik Option. Check list ( )
Include constant in equation, lalu klik Continue, dan terakhir klik Ok. Maka akan
muncul ouput sebagai berikut (ditampilkan sebagian):
Regression
Variables Entered/Removed
Variables Variables
Model Entered Removed Method
Model Summary
ANOVAb
Total 600.000 9
Coefficientsa
Hasil perhitungan di atas disajikan dalam bentuk tabel Anava sebagai berikut.
Kesimpulan: Model regresi linier ganda cocok untuk memodelkan hubungan antara
tingkat IQ (X1) dan motivasi (X2) terhadap nilai mahasiswa (Y).
Ringkasan langkah-langkah perhitungan di atas dapat disajikan dalam bentuk tabel Anava
sebagai berikut.
Kesimpulan: Terdapat pengaruh bersama yang signifikan dari tingkat IQ dan motivasi
terhadap nilai mahasiswa.
Total 600.000 9
Nilai total pada baris terakhir dari output SPSS adalah Total Terkoreksi yang dirumuskan
sebagai
Total Terkoreksi = JKTot – JKReg(0). = 51010 – 50410 = 600.
Pada tabel Anova di atas terlihat nilai F hitung = 60,108, sama dengan yang
diperoleh secara manual. Pada kolom terakhir (kolom Sig.) terlihat angka 0.000.
Bandingkan angka ini dengan taraf signifikansi yang kita tetapkan. Ketentuannya
adalah tolak H0 jika Sig < . Sebagai contoh jika kita pilih = 0,05 maka H0 ditolak
sehingga kesimpulannya adalah terdapat pengaruh yang signifikan dari tingkat IQ dan
motivasi terhadap nilai mahasiswa.
Dalam regresi linier ganda dengan dua variabel independen ada tiga parameter
yang dapat diuji secara individual. Rumusan hipotesisnya adalah:
H0 : i = 0
H1 : i 0 (atau H1 : i > 0 atau H1 : i < 0)
dengan i diganti 0, 1, atau 2, tergantung mana yang akan diuji.
Untuk menguji hipotesis secara individual dapat digunakan uji F atau uji t. Rumus
statistik uji F agak rumit untuk diberikan di sini dan akan diberikan di Bab 4 dengan
menggunakan notasi matriks, sedangkan rumus umum statistik uji t adalah sebagai
berikut:
(3.26)
dimana bi adalah estimator untuk i dan SE(bi) adalah standar error untuk bi. Nilai SE(bi)
dapat dilihat pada output SPSS.
Jika ditetapkan taraf signifikansi = 0,05 maka kesimpulan yang dapat diambil adalah
sebagai berikut:
1. Karena Sig. pada baris Constant 0.927 > 0,05 maka H0 : 0 = 0 diterima sehingga 0
tidak perlu dimasukkan ke dalam model regresi linier ganda.
2. Karena Sig. pada baris IQ 0.002 < 0,05 maka H0 : 1 = 0 ditolak sehingga terdapat
pengaruh signifikan dari IQ terhadap nilai mahasiswa meskipun pengaruh motivasi
diperhitungkan (dimasukkan ke dalam model).
3. Karena Sig. pada baris Motivasi 0.142 > 0,05 maka H0 : 2 = 0 diterima sehingga
tidak terdapat pengaruh signifikan dari motivasi terhadap nilai mahasiswa apabila
pengaruh IQ telah diperhitungkan (dimasukkan ke dalam model).
Catatan Penting
1. Jika dilakukan analisis regresi linier sederhana menggunakan SPSS dengan variabel
independen Motivasi dan variabel dependen Nilai Mahasiswa, maka sebagian
outputnya adalah sebagai berikut:
Model Summary
ANOVAb
Total 600.000 9
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Terlihat bahwa Sig. pada baris Motivasi 0,001. Hal ini berarti bahwa motivasi
mempunyai pengaruh (positif) terhadap nilai mahasiswa jika faktor IQ diabaikan.
Ingat bahwa pada regresi linier ganda motivasi tidak berpengaruh secara signifikan
terhadap nilai mahasiswa jika faktor IQ diperhitungkan. Mengapa hal ini dapat
terjadi? Hal ini karena ada multikolinieritas (ada hubungan linier yang kuat) antara
IQ dan motivasi dengan koefisien korelasi
3.3.13 Koefisien Determinasi
Pada Contoh 3.5 juga telah kita hitung JKRes = 33,014575. Dengan menggunakan rumus
(3.28) diperoleh
dan dengan menggunakan rumus (3.32) (di sini banyaknya variabel independen k = 2)
diperoleh
.
Nilai koefisien determinasi juga dapat dilihat langsung dari output SPSS berikut:
Model Summary
Nilai R2 = 0,945 dan nilai Ra2 (Adjusted R2) = 0,929 dapat dilihat pada kolom ketiga dan
keempat.
Model matematika untuk regresi linier dengan tiga variabel independen adalah
Y = 0 + 1X1 + 2X2 + 3X3 + (3.34)
dimana X1, X2 dan X3 adalah variabel-variabel independen, Y adalah variabel dependen,
adalah sesatan acak, dan 0, 1, 2 dan 3 adalah parameter regresi.
Pada bagian ini akan ditunjukkan bagaimana menggunakan software SPSS untuk
menghitung estimator b0, b1, b2, b3, dan s2. Langkah-langkahnya adalah sebagai berikut.
Langkah 2. Klik menu Analyze, sorot Regression, lalu pilih Linear, maka akan muncul
kotak dialog Linear Regression. Masukkan variabel Mat, BI dan Kes ke kotak
independent(s) dan variabel IPA ke kotak Dependent sehingga diperoleh tampilan
sebagai berikut:
Langkah 3. Pada kotak dialog Linear Regression klik Statistics. Check list ( )
Estimates untuk memunculkan nilai-nilai estimator. Check list ( ) Confidence
intervals untuk memunculkan interval konfidensi. Check list ( ) Model fit untuk
memunculkan tabel Anova, lalu klik Continue. Selanjutnya klik Option. Check list ( )
Include constant in equation, lalu klik Continue, dan terakhir klik Ok. Maka akan
muncul ouput sebagai berikut:
Regression
Variables Entered/Removed
Variables Variables
Model Entered Removed Method
Model Summary
ANOVAb
Total 8.000 9
Hasil perhitungan di atas disajikan dalam bentuk tabel Anava sebagai berikut.
Kesimpulan: Model regresi linier ganda cocok untuk memodelkan hubungan antara
kemampuan siswa dalam bidang Matematika (X1), Bahasa Indonesia (X2), dan Kesenian
(X3) terhadap kemampuan dalam bidang IPA (Y).
Ringkasan langkah-langkah perhitungan di atas dapat disajikan dalam bentuk tabel Anava
sebagai berikut.
Kesimpulan: Terdapat pengaruh bersama yang signifikan dari kemampuan siswa dalam
bidang Matematika (X1), Bahasa Indonesia (X2), dan Kesenian (X3) terhadap kemampuan
dalam bidang IPA (Y).
Aplikasi SPSS
Uji hipotesis pada contoh di atas dapat dengan mudah dilakukan dengan
menggunakan software SPSS. Pada Sub-Bagian 3.4.3 telah diperoleh output SPSS
sebagai berikut:
ANOVAb
Total 8.000 9
Nilai total pada baris terakhir dari output SPSS adalah Total Terkoreksi yang dirumuskan
sebagai
Total Terkoreksi = JKTot – JKReg(0). = 498 – 490 = 8.
Pada tabel Anova di atas terlihat nilai F hitung = 13,221 (sedikit berbeda dengan
perhitungan secara manual yang dikarenakan adannya pembulatan pada proses
perhitungan). Pada kolom terakhir (kolom Sig.) terlihat angka 0.005. Jika dipilih = 0,05
maka H0 ditolak sehingga kesimpulannya adalah terdapat pengaruh yang signifikan dari
kemampuan siswa dalam bidang Matematika (X1), Bahasa Indonesia (X2), dan Kesenian
(X3) terhadap kemampuan dalam bidang IPA (Y).
dimana bi adalah estimator untuk i dan SE(bi) adalah standar error untuk bi. Rumus
untuk SE(bi) juga agak rumit untuk diberikan di sini dan akan diberikan dengan notasi
matriks di Bab 4. Akan tetapi nilai SE(bi) dapat dilihat pada output SPSS.
Contoh 3.12 (Lanjutan Contoh 3.8 – 3.11: Menguji Parameter secara Individual)
Pada Contoh 3.10 dan 3.11 telah diuji dan disimpulkan bahwa model regresi linier
ganda cocok dan terdapat pengaruh bersama dari kemampuan siswa dalam bidang
Matematika (X1), Bahasa Indonesia (X2), dan Kesenian (X3) terhadap kemampuan dalam
bidang IPA (Y). Pada contoh akan dilakukan uji lanjutan, yakni uji parameter secara
individual.
Perhatikan output SPSS yang telah diperoleh pada Sub-Bagian 3.4.3 sebagai
berikut:
Coefficientsa
Pada baris pertama (baris Constant) diperoleh b0 = 0,108 dan SE(b0) = 2,485, sehingga
nilai statistik uji untuk menguji H0: 0 = 0 adalah
bukan merupakan model yang baik karena dari uji parameter secara individual
disimpulkan Bahasa Indonesia (X2) dan Kesenian (X3) tidak berpengaruh secara
signifikan terhadap IPA. Meskipun demikian kita tidak boleh mengeluarkan/
menghapus X2 dan X3 dari dalam model. Jika ini dilakukan maka akan
mengakibatkan adanya kesalahan type II yang lebih besar dalam uji hipotesis.
Ingat bahwa ketika kita menguji pengaruh Bahasa Indonesia variabel Matematika
dan Kesenian masuk ke dalam model, dan ketika kita menguji pengaruh Kesenian
variabel bahasa Indonesia masuk ke dalam model.
2. Untuk memperoleh model yang lebih baik dapat dicoba dengan mengeluarkan
salah satu variabel yang memiliki nilai Sig. yang lebih besar (variabel Kesenian).
Hasil analisis dengan SPSS setelah data Kesenian tidak digunakan adalah sebagai
berikut:
Model Summary
Standardized
Unstandardized Coefficients Coefficients
dan
(3.45)
Nilai R2 menyatakan proporsi variasi variabel Y yang dijelaskan oleh variabel-variabel
independen X1, X2, dan X3.
Kita dapat juga menghitung adjusted multiple coefficient of determination (Ra2)
yang dirumuskan pada (3.31), yakni
(3.46)
dengan mengambil k = 3.
Pada Contoh 3.10 juga telah dihitung JKRes = 1,051205. Dengan menggunakan rumus
(3.43) diperoleh
.
Nilai koefisien determinasi juga dapat dilihat langsung dari output SPSS berikut
(lihat Sub-Bab 3.4.3):
Model Summary
Terlihat bahwa nilai R2 = 0,869 dan nilai Ra2 (Adjusted R2) = 0,803, sama seperti yang
diperoleh secara manual.