Anda di halaman 1dari 6

8.

3 Regresi Linear Ganda 71

8.3 Regresi Linear Ganda


Misal mahasiswa yang tertarik ingin mencari tahu pengaruh efikasi diri dan hasil
belajar mahasiswa seperti pada contoh di atas kemudian juga tertarik untuk mencari
tahu pengaruh kecerdasan emosional terhadap hasil belajar mahasiswa. Mahasiswa
tersebut kemudian merevisi judulnya menjadi "Efikasi Diri dan Kecerdasan Emosio-
nal serta Efeknya terhadap Hasil Belajar Mahasiswa".
Judul skripsi seperti yang diinginkan mahasiswa tersebut tidak lagi bisa dimodelk-
an dengan regresi linear sederhana. Penelitian dengan judul seperti itu, melibatkan 2
variabel prediktor. Sedangkan model regresi sederhana yang telah dibahas di bagian
sebelumnya, hanya mewadahi 1 variabel bebas.
Meskipun demikian, model regresi linear masih punya bagian yang secara khusus
menganalisis model linear dengan 2 atau lebih variabel prediktor. Model ini disebut
sebagai regresi linear ganda. Di bagian ini, model regresi ganda yang dibahas adalah
model dengan tepat 2 variabel prediktor. Adapun model regresi linear ganda adalah
sebagai berikut:
Y = α + β1 .X1 + β2 .X2 +   ∼ N (0, 1)
Dengan
Y : Variabel respon
X1 : Variabel prediktor pertama
X2 : Variabel prediktor kedua
Pada model regresi linear ganda di atas, ada 3 parameter yang perlu dihitung nilainya.
Parameter pertama adalah α yang merupakan parameter yang menunjukkan baseline
dari persamaan regresi. Parameter kedua adalah β1 yang merupakan parameter yang
menjadi acuan besarnya pengaruh X1 terhadap Y. Yang terakhir, β2 merupakan
parameter besaran pengaruh X2 terhadap Y. Formula untuk memperoleh nilai dari
ketiga parameter ini adalah:
( x22 )( x1 .y)−( x1 .x2 )(x2 .y)
P P P
β1 = P 2 P 2
( x1 )( x2 )−( x1 .x2 )2
P

( x21 )( x2 .y)−( x1 .x2 )(x1 .y)


P P P
β2 = P 2 P 2
( x1 )( x2 )−( x1 .x2 )2
P

α = Ȳ − β1 X̄1 − β2 X̄2
Setelah mengestimasi 3 parameter dalam model regresi linear ganda, langkah selan-
jutnya sama dengan langkah pada model regresi linear sederhana, yaitu menguji
tingkat keberartian model untuk menjawab pertanyaan: "Apakah variabel Y dapat
diprediksi oleh variabel X1 dan variabel X2 ?". Menjawab pertanyaan ini dilakukan
dengan menguji hipotesis statistik berikut:
H0 : Ada minimal satu variabel prediktor yang tidak berpengaruh signifikan
Ha : Semua variabel prediktor berpengaruh signifikan
Sama seperti model regresi linear sederhana, uji statistik yang digunakan adalah uji
F yang formulanya sebagai berikut:
R2 (n − m − 1)
Fhit =
m(1 − R2 )

Wirawan Setialaksana, S.Pd., M.Sc.


72 Bab 8. Regresi Linear

dengan:
n :Jumlah sampel
m :Jumlah variabel prediktor
q P P
β1 x1 .y+β
P 22 x2 .y
R = y

Untuk memahami mengenai regresi ganda ini, perhatikan contoh berikut:

Contoh 8.2 Konteks yang digunakan dalam contoh ini adalah konteks mahasiswa
yang dijadikan pengantar di awal pembahasan regresi ganda ini. Judul penelitian
mahasiswa tersebut adalah "Efikasi Diri dan Kecerdasan Emosional serta Efeknya
terhadap Hasil Belajar Mahasiswa". Dari judul ini, diketahui variabel responnya
(Y) adalah hasil belajar. Sedangkan variabel prediktor nya ada 2 yaitu efikasi diri
(X1 ) dan Kecerdasan Emosional (X2 ). Langkah pertama yang dilakukan adalah
melakukan uji coba terhadap instrumen efikasi diri dan kecerdasan emosional
siswa.Uji coba menunjukkan bahwa instrumen yang digunakan reliabel dan valid
(meskipun beberapa item dalam instrumen harus dikeluarkan dari instrumen).
Langkah selanjutnya yang dilakukan oleh mahasiswa tersebut adalah menentuk-
an jumlah sampel. Sampel yang diperoleh sebanyak 8 orang yang akan diberikan
instrumen efikasi diri, kecerdasan emosional dan hasil belajar siswa tentu saja.
Setelah mengambil data dari 8 orang sampel penelitian, diperoleh hasil sebagai
berikut:

Resp. Y X1 X2 X12 X22 X1 .Y X2 .Y X1 .X2


A 67 62 58 3844 3364 4489 3886 3596
B 71 64 62 3969 4356 4473 4686 4158
C 70 64 60 4225 3600 4550 4200 3900
D 75 67 70 4489 4900 5025 5250 4690
E 72 70 68 5041 4624 5112 4896 4828
F 68 64 60 4225 3600 4420 4080 3900
G 81 75 72 5625 5184 6075 5832 5400
H 86 75 78 5625 6084 6450 6708 5850
Total 590 541 528 36771 35200 40120 39254 35944

Dari tabel diatas dapat diperoleh:

Ȳ =73,75; X̄1 =67,625; X̄2 =66;

Selain itu dengan bantuan tabel di atas, 3 parameter dari regresi linear ganda
dapat lebih mudah dihitung.

Wirawan Setialaksana, S.Pd., M.Sc.


8.4 Variabel Dummy 73
( x22 )( x1 .y)−( x1 .x2 )(x2 .y) ( x21 )( x2 .y)−( x1 .x2 )(x1 .y)
P P P P P P
β1 = P 2 P 2
( x1 )( x2 )−( x1 .x2 )2
P β2 = P 2 P 2
( x1 )( x2 )−( x1 .x2 )2
P

(35200).(40120)−(35944)(39254) (36771).(39254)−(35944)(40120)
= (36771)(35200)−(35944)2
= (36771)(35200)−(35944)2

1278224 1335554
= 2368064
= 2368064

= 0, 54 = 0, 564
Setelah memperoleh β1 dan β2 , parameter α akan dicari dengan formula:
α = Ȳ − β1 X̄1 − β2 X̄2
= 73, 75 − 0, 54.67, 625 − 0, 564.66
= 73, 75 − 36, 52 − 37, 22
=0,01
Berdasarkan pendugaan 3 parameter yang telah dikerjakan, maka model regresi
linear ganda dari hasil penelitian mahasiswa tersebut adalah:

Y = 0, 01 + 0, 54.X1 − 0, 564.X2

Berdasarkan model diatas, dapat disimpulkan bahwa setiap kenaikan efikasi


diri sebesar 10, maka hasil belajar akan naik sebesar 5,4. Begitu pula
dengan variabel prediktor kedua, setiap kenaikan kecerdasan emosional se-
besar 10, hasil belajar akan naik sebesar 5,64.
Langkah pengujian modelnya (Uji F) diserahkan kepada pembaca.

Setelah membahas regresi serhana dan regresi linear ganda, pada bagian selanjutnya
akan dibahas kasus khusus mengenai variabel prediktor yang berbentuk data katergori
yang dalam regresi disebut sebagai variabel boneka (dummy)

8.4 Variabel Dummy


Dalam keadaan-keadaan tertentu, variabel prediktor yang digunakan dalam model
regresi tertentu bukan data kuantitatif, namun berbentuk data kualitatif khususnya
data kategorik. Dalam statistik, data kategorik yang dimaksud adalah data nominal.
Pengolahan variabel seperti ini dalam model regresi membutuhkan penggunaan
variabel boneka atau dummy.

Variabel Dummy dengan 2 Kategori


Variabel dummy dengan 2 kategori ini artinya bahwa variabel prediktor yang digu-
nakan hanya terdiri dari 2 kelompok. Sebagai contoh, seorang peneliti ingin melihat
pengaruh jenis kelamin terhadap hasil belajar mahasiswa di prodi P. Jenis kelamin
sebagai variabel prediktor dalam penelitian ini memiliki 2 kemungkinan yang saling
bebas, yaitu "perempuan" dan "laki-laki". Agar dapat dianalisis menggunakan
model regresi, variabel prediktor ini (X) diberikan kode 0 dan 1 sebagai berikut:

Wirawan Setialaksana, S.Pd., M.Sc.


74 Bab 8. Regresi Linear
(
1; untuk perempuan
xi =
0; untuk laki − laki
Penelitian ini memiliki 1 variabel prediktor dan 1 variabel respon, sehingga model
regresi yang digunakan adalah sebagai berikut:
Y = α + β.X + i ; i ∼ N (0, 1)
Lalu bagaimana interpretasi terhadap model regresi dengan variabel Dummy di atas?.
Misal setelah data penelitian di atas dianalis sehingga diperoleh model:
Y = 3, 46 + 0, 12.X + i ; i ∼ N (0, 1)
Perhatikan bahwa saat responden berjenis kelamin laki-laki (yang artinya xi = 0),
maka model pengaruh jenis kelamin dan hasil belajar di atas dituliskan sebagai:
Y = 3, 46 + 0, 12.X
= 3, 46 + 0, 12.(0)
= 3, 46
Artinya, rata-rata IPK untuk responden laki-laki adalah 3,46. Sedangkan untuk
perempuan (yang artinya xi = 1), modelnya menjadi:
Y = 3, 46 + 0, 12.X
= 3, 46 + 0, 12.(1)
= 3, 46 + 0, 12
= 3, 58
Dari model di atas, rata-rata IPK perempuan lebih tinggi daripada laki-laki. Lalu,
apakah kuantifikasi dari kategori seperti diatas boleh ditukar menjadi laki-laki diberi
simbol 1 dan perempuan diberi simbol 0?. Boleh saja. Model yang diperoleh akan
sedikit berubah menjadi:
Y = 3, 58 − 0, 12.X + i ; i ∼ N (0, 1)
namun kesimpulannya tidak berubah. Mengapa? Jawaban atas pertanyaan ini
diberikan kepada pembaca sebagai tugas

Variabel Dummy dengan Lebih dari 2 Kategori


Misal seorang mahasiswa ingin menjawab pertanyaan: "Di prodi saya ini, apakah
lulusan SMK yang punya hasil belajar yang paling baik? atau justru lulusan SMA?
atau MA?". Mahasiswa ini kemudian memutuskan untuk melakukan penelitian seder-
hana dengan mengumpulkan data IPK dan jenis sekolah menengah dari mahasiswa
di prodinya. Ia ingin melihat pengaruh jenis sekolah menengah yang telah dilulusi
mahasiswa terhadap hasil belajarnya.
Analisis data penelitian di atas bisa dilakukan dengan ANOVA, atau menggu-
nakan analisis regresi. Jika mahasiswa tersebut memutuskan untuk menggunakan
analisis regresi, maka variabel jenis sekolah menengah yang terdiri dari 3 kategori:
SMK, SMA, dan MA. Karena berupa data kategorik, variabel ini harus diubah
menjadi variabel dummy. Jumlah variabel dummy yang digunakan adalah 2, yaitu
X1 dan X2 . Bagaimana setting dari variabel dummy ini? Perhatikan kuantifikasi
kedua variabel dibawah:

Wirawan Setialaksana, S.Pd., M.Sc.


8.5 Statistik R2 75
(
1; untuk SM A
x1i =
0; untuk bukan SM A
(
1; untuk M A
x2i =
0; untuk bukan M A

Berdasarkan definisi kuantifikasi di atas, angka untuk X1 dan X2 pada masing-masing


kelompok ditunjukkan oleh tabel dibawah:

Jenjang X1 X2
SMK 0 0
SMA 1 0
MA 0 1

Tabel 8.1. Tabel Kuantifikasi Sekolah Menengah dengan 3 kategori

Kasus diatas menggunakan 2 variabel dummy sebagai variabel prediktornya,


sehingga model regresinya berbentuk:
Y = α + β1 .X1 + β2 .X2 + i ; i ∼ N (0, 1)
Misal, setelah mengumpulkan data dan melakukan analisis regresi dengan 2 variabel
dummy terhadap data, mahasiswa tersebut memperoleh model:
Y = 3, 64 − 0, 08.X1 − 0, 14.X2 + i ; i ∼ N (0, 1)
Interpretasi terhadap model ini dapat dilakukan dengan merujuk pada tabel 8.1
di atas. IPK rata-rata lulusan SMK diperoleh dengan mensubstitusi X1 = 0 dan
X2 = 0.
Y = 3, 64 − 0, 08.X1 − 0, 14.X2
= 3, 64 − 0, 08.(0) − 0, 14(0)
= 3, 64 − 0 − 0
= 3, 64
Berdasarkan hasil di atas, IPK rata-rata lulusan SMK adalah 3,64. Bagaimana
dengan IPK lulusan SMA dan MA berdasarkan model regresi di atas?.
Bagaimana kesimpulannya?. Kedua pertanyaan ini diberikan sebagai tugas untuk
dikerjakan oleh mahasiswa.

8.5 Statistik R2
Salah satu output dari regresi linear yang dijadikan hasil pemodelan – selain modelnya
tentu saja – adalah R2 . R2 biasa juga disebut sebagai koefisien determinasi. Formula
dari koefisien determinasi adalah:
JKT − JKR JKR
R2 = =1−
JKT JKT
dengan

Wirawan Setialaksana, S.Pd., M.Sc.


76 Bab 8. Regresi Linear

(yi − ȳ)2
P
JKT =

(yi − ŷi )2
P
JKR =

Koefisien determinasi mengukur proporsi variabilitas variabel respon yang dapat


dijelaskan oleh variabilitas variabel prediktor. Semakin besar koefisien determinasi,
semakin baik model tersebut. Karena variabel prediktor mampu dengan baik meng-
gambarkan variabilitas dari variabel respon.
Pada regresi linear sederhana, nilai dari koefisien determinasi sama dengan koefi-
sien korelasi antara variabel prediktor (X) dan variabel respon (Y) – ingat kembali
materi analisis korelasi Pearson Product Moment. Namun pada regresi linear gan-
da, koefisien determinasi menjadi lebih kompleks karena melibatkan lebih dari 1
variabel prediktor yang akan diukur kemampuan semua variabel prediktor secara
bersama-sama menggambarkan variabilitas dari variabel respon.

8.6 Kondisi Gauss Markov


Model regresi dibangun pada kondisi dan asumsi tertentu. Sehingga, saat melakukan
analisis regresi, pemenuhan terhadap kondisi ini perlu diperiksa juga. Asumsi yang
perlu dipenuhi dalam model regresi disebut sebagai kondisi Gauss Markov. Kondisi-
kondisi markov ini berhubungan dengan galat () dari model regresi yang diperoleh.
Sehingga, pengecekan terhadap kondisi Gauss-Markov dilakukan setelah memperoleh
model regresi dari data. Kondisi Gauss-Markov terdiri atas kondisi zero mean,
homoskedastisitas, dan autokorelasi.

Zero Mean
Perhatikan kembali model regresi yang telah dibahas sebelumnya:

Y = α + β.X +   ∼ N (0, 1)

Dalam model di atas, galat dari model () harus berdisitribusi normal dengan rata-
rata 0 dan varians 1 (dituliskan  ∼ N (0, 1)). Kondisi ini disebut sebagai kondisi zero
mean. Kondisi ini berpusat pada galat dari model. Sehingga, pengecekan terhadap
galat ini dilakukan dengan membangkitkan galat dari model, kemudian melakukan
pengecekan terhadap distribusi dari galat.
Pengecekan normalitas galat dari data dapat dilakukan dengan Uji Shapiro
Wilk, Uji Kolmogorov-Smirnov, serta menggunakan bantuan grafik tertentu di SPSS.
Hipotesis yang digunakan dalam uji normalitas adalah

H0 : Data berdistribusi normal


Ha : Data tidak berdistribusi normal

Pengujian atas hipotesis statistik di atas dilakukan dengan mengidentifikasi p-value


dari uji yang digunakan. Jika p-value nya bernilai kurang dari 0,05 maka H0 ditolak.
Sebaliknya, jika p − value > 0, 05 maka H0 tidak ditolak.

Wirawan Setialaksana, S.Pd., M.Sc.

Anda mungkin juga menyukai