Anda di halaman 1dari 16

BAB IV

REGRESI LINEAR BERGANDA

A. Regresi Linear Berganda


Regresi Linear Berganda atau multiple linier regression adalah model regresi
yang terdiri dari satu variabel Y dan lebih dari satu variabel X. Artinya, Variabel X
bisa berjumlah 2, 3, atau lebih. Bertambahnya jumlah variabel X hingga lebih
darisatu sangat memungkinkan, karena dalam keilmuan sosialsemua faktor-vaktor
atau variabel-variabel saling berkaitan satu dengan lainnya.
Perubahan model dari bentuk single ke dalam bentukmultiple mengalami
beberapa perubahan, :
1. jumlah variabel penjelasnya bertambah, sehinggaspesifikasi model dan data
terjadi penambahan.
2. rumuspenghitungan nilai b mengalami perubahan,
3. jumlah degree of freedom dalam menentukan nilai t juga berubah.

Model Regresi Linear Berganda


Populasi:

Y = A + B1X1 + B2X2 + B3X3 + + BnXn + e


Atau
Y = B0 + B1X1 + B2X2 + B3X3 + + BnXn + e

Sampel :

Y = a + b1X1 + b2X2+ b3X3+ + bnXn + e


Atau
Y = b0 + b1X1+ b2X2+ b3X3+ + bnXn + e
B. Perhitungan Nilai Parameter
Penggunaan metode OLS dalam regresi linierberganda dimaksudkan untuk
mendapatkan aturan dalammengestimasi parameter yang tidak diketahui. Prinsipyang
terkandung dalam OLS sendiri adalah untukmeminimalisasi perbedaan jumlah
kuadrat kesalahan (sumof square) antara nilai observasi Y dengan Y.
Secaramatematis, fungsi minimalisasi sum of square ditunjukkandalam rumus:

Untuk mendapatkan estimasi least square b0, b1,b2minimum, dapat dilakukan


melalui cara turunan parsial(partially differentiate) dari formula di atas,
sebagaiberikut:

Jadikan nilai-nilai turunan parsial di atas menjadi samadengan 0 (nol), dengan


cara membagi dengan angka 2,hingga menjadi:
Untuk menyederhanakan rumus paling atas dilakukanpembagian dengan n,
sehingga memperoleh rumus barusebagai berikut:

jika kita notasikan:

maka b1 dan b2 dapat dicari dengan rumus:

Pencarian nilai bpada single linier berbeda dengan multiple linier.Perbedaan


ini muncul karena jumlah variabel penjelasnyabertambah. Semakin banyaknya
variabel X ini makakemungkinan-kemungkinan yang menjelaskan model
jugamengalami pertambahan. Dalam single linierkemungkinan perubahan variabel
lain tidak terjadi, tetapidalam multiple linier hal itu terjadi. Misalnya, Jika
terjadiperubahan pada X1, meskipun X2 konstan, akan mampumerubah nilai harapan
dari Y. Begitu pula, perubahanpada X2, meskipun X1 konstan, akan mampu
merubahnilai harapan dari Y. Perubahan yang terjadi pada X1 atauX2 tentu
mengakibatkanperubahan nilai harapan Y atauE(Y/X1,X2) yang berbeda. Oleh karena
itu pencarian nilaib mengalami perubahan.
Guna mengetahui seberapa besar kontribusi X1terhadap perubahan Y, tentu
perlu untuk melakukankontrol pengaruh dari X2. Begitu pula, untuk
mengetahuikontribusi X2, maka perlu juga melakukan kontrolterhadap X1. Misalnya
kita hendak mengontrol pengaruh linier X2ketika melakukan pengukuran dampak
dari perubahan X1terhadap Y, maka dapat melakukan langkah-langkahsebagai
berikut:

1. Tahap pertama: lakukan regresi Y terhadap X2.

Y = b0 + b2 X2 + e1

Dimana e1 merupakan residual, yang besarnya:

e1 = Y b0 b2X2
= Y-Y

2. Tahap kedua: lakukan regresi X1 terhadap X2

X1 = b0 + b2 X2 + e2

Dimana e1 merupakan residual, yang besarnya:

e2 = X1 b0 b2X2
= X1-X
3. Tahap ketiga: lakukan regresi e1 terhadap e2

e1 = a0 + a1e2 +e3

Besarnya a1 pada tahap ketiga inilah yangmerupakan nilai pasti atau net effect
dari perubahan satuunit X1 terhadap Y, atau menunjukkan kemiringan (slope)garis Y
atas variabel X1.Logika dari teori tersebut yang mendasari rumusyang dapat
digunakan untuk menentukan koefisien regresiparsial (partial regression
coefficients).
Nilai dari parameter b1 dan b2 merupakan nilai darisuatu sampel. Nilai b1
dan b2 tergantung pada jumlahsampel yang ditarik. Penambahan atau pengurangan
akan mengakibatkan perubahan rentangan nilai b. Perubahanrentang nilai b1 dan b2
diukur dengan standar error.Semakin besar standar error mencerminkan nilai
bsebagai penduga populasi semakin kurang representatif.Sebaliknya, semakin kecil
standar error maka keakuratandaya penduga nilai b terhadap populasi semakin
tinggi.Perbandingan antara nilai b dan standar error inimemunculkan nilai t, yang
dapat dirumuskan sebagaiberikut:

dimana:
b = nilai parameter
Sb = standar error dari b. Jika b sama dengan 0 (b=0) atauSb bernilai sangat besar,
maka nilai t akan sama denganatau mendekati 0 (nol).

Untuk dapat melakukan uji t, perlu menghitung besarnyastandar error masing-


masing parameter ( baik b0, b1, b2),seperti diformulakan Gujarati (1995:198-199)
sebagaiberikut:
Rumus-rumus di atas, dapat kita masuki denganangka-angka yang tertera
pada tabel, hanya saja belumsemuanya dapat terisi. Kita masih memerlukan lagi

angkauntuk mengisi rumus e2 . Untuk dapat mengisi rumustersebut, perlu terlebih

dulu mencari nilai e. Nilai e adalahstandar error yang terdapat dalam persamaan
regresi.

Perhatikan persamaan regresi:

Y = b0 + b1X1 + b2 X2 + e
Secara matematis, dari persamaan regresi di atas nilai edapat diperoleh, dengan cara
mengubah posisi tandapersamaan hingga menjadi:

eY- (b0 + b1X1 + b2 X2)

Setelah diketahui semua nilai standar error (Sb0, Sb1, Sb2)melalui penggunaan
rumus-rumus di atas, maka nilai tuntuk masing-masing parameter dapat diperoleh,
karenanilai t merupakan hasil bagi antara b dengan Sb.

Pencarian masing-masing nilai t dapat dirumuskansebagai berikut:

dengan diketahuinya nilai t hitung masing-masingparameter, maka dapat digunakan


untuk mengetahuisignifikan tidaknya variabel penjelas dalam mempengaruhi
variabel terikat. Untuk dapat mengetahuiapakah signifikan atau tidak nilai t hitung
tersebut, makaperlu membandingkan dengan nilai t tabel. Apabila nilai thitung lebih
besar dibandingkan dengan nilai t tabel, makavariabel penjelas tersebut signifikan.
Sebaliknya, jika nilai t hitung lebih kecil darit tabel, maka variabel penjelastersebut
tidak signifikan.
C. Koefisien Determinasi (R2)
Koefisien determinasi pada dasarnya digunakanuntuk mengkur goodness of
fit dari persamaan regresi,melalui hasil pengukuran dalam bentuk prosentase
yangmenjelaskan determinasi variabel penjelas (X) terhadapvariabel yang dijelaskan
(Y). Koefisiendeterminasi dapatdicari melalui hasil bagi dari total sum of square
(TSS)atau total variasi Y terhadap explained sum of square(ESS) atau variasi yang
dijelaskan Y. Dengan demikiankita dapat mendefinisikan lagi R2 dengan arti rasio
antaravariasi yang dijelaskan Y dengan total variasi Y. Rumustersebut adalah sebagai
berikut:

Total variasi Y (TSS) dapat diukur menggunakanderajat deviasi dari masing-masing


observasi nilai Y darirata-ratanya. Hasil pengukuran ini kemudian
dijumlahkanhingga mencakup seluruh observasi. Jelasnya:

Nilai explained sum of square (ESS) atau variasiyang dijelaskan Y didapat dengan
menggunakan rumussebagai berikut:

Jadi, rumus di atas dapat pula dituliskan menjadisebagai berikut:


Y cap diperoleh dengan cara menghitung hasilregresi dengan memasukkan nilai
parameter dan datavariabel. Penghitungan nilai Y cap menjadi penting
untukdilakukan agar mempermudah kita dalam menggunakanrumus R2 yang telah
ditentukan di atas.

Uji F
Seperti telah dikemukakan di atas, bahwa dalamregresi linier berganda
variabel penjelasnya selaluberjumlah lebih dari satu. Untuk itu, maka
pengujiantingkat signifikansi variabel tidak hanya dilakukan secaraindividual saja,
seperti dilakukan dengan uji t, tetapi dapat pula dilakukan pengujian signifikansi
semua variabelpenjelas secara serentak atau bersama-sama. Pengujiansecara serentak
tersebut dilakukan dengan teknik analisisof variance (ANOVA) melalui pengujian
nilai F hitungyang dibandingkan dengan nilai F tabel. Oleh karena itudisebut pula
dengan uji F.
Pada prinsipnya, teknik ANOVA digunakan untukmenguji distribusi atau
variansi means dalam variabelpenjelas apakah secara proporsional telah
signifikanmenjelaskan variasi dari variabel yang dijelaskan. Untukmemastikan
jawabannya, maka perlu dihitung rasio antaravariansi means (variance between
means) yangdibandingkan dengan variansi di dalam kelompokvariabel (variance
between group). Hasil pembandingankeduanya itu (rasio antaravariance between
meansterhadap variance between group) menghasilkan nilai F hitung, yang
kemudian dibandingkan dengan nilai F tabel.
Jika nilai F hitung lebih besar dibanding nilai F tabel,maka secara serentak
seluruh variabel penjelas yang adadalam model signifikan mempengaruhi variabel
terikat Y.Sebaliknya, jika nilai F hitung lebih kecil dibandingkandengan nilai F tabel,
maka tidak secara serentak seluruhvariabel penjelas yang ada dalam model
signifikanmempengaruhi variabel terikat Y.

H0 diterima atau ditolak, merupakan suatukeputusan jawaban terhadap hipotesis


yang terkait denganuji F, yang biasanya dituliskan dalam kalimat sebagaiberikut:

H0 : b1 = b2 = 0 Variabel penjelas secara serentak tidaksignifikan mempengaruhi


variabel yangdijelaskan.
H0 : b1 b2 0 Variabel penjelas secara serentaksignifikan mempengaruhi variabel
yang
dijelaskan.

Karena uji F adalah membandingkan antara nilai F hitungdengan nilai F tabel, maka
penting untuk mengetahuibagaimana mencari nilai F hitung ataupun nilai F
tabel.Nilai F hitung dapat dicari dengan menggunakan rumussebagai berikut:

Sedangkan nilai F tabel telah ditentukan dalam tabel.Yang penting untuk diketahui
adalah bagaimana caramembaca tabelnya. Seperti yang telah dituliskan
padapembandingan antara nilai F hitung dan nilai F tabel diatas, diketahui bahwa F
tabel dituliskan F;k-1; (n-k).
Arti dari tulisan tersebut adalah:
Simbolmenjelaskan tingkat signifikansi (level ofsignificance) (apakah
pada0,05atau0,01ataukah 0,10, dan seterusnya).
Simbol (k-1) menunjukkan degrees of freedom fornumerator.
Simbol (n-k) menunjukkan degrees of freedom fordenominator.

MENJAWAB PERTANYAAN REGRESI LINIER BERGANDA


1) Coba jelaskan apa yang dimaksud denganregresi linier berganda!
Regresi Linear Berganda atau multiple linier regression adalah model regresi
yang terdiri dari satu variabel Y dan lebih dari satu variabel X. Artinya, Variabel
X bisa berjumlah 2, 3, atau lebih.
2) Coba tuliskan model regresi linier berganda!

a) Populasi:
Y = A + B1X1 + B2X2 + B3X3 + + BnXn + e
Atau
Y = B0 + B1X1 + B2X2 + B3X3 + + BnXn + e

b) Sampel :

Y = a + b1X1 + b2X2+ b3X3+ + bnXn + e


Atau
Y = b0 + b1X1+ b2X2+ b3X3+ + bnXn + e

a. Coba uraikan arti dari notasi atas model yangtelah anda tuliskan!
Y = Variabel Terikat
b0= konstanta
b1,2,3= koefisien regresi
X1,2,3= Variabel Bebas
e= error term
b. Jelaskan informasi apa yang dapat diungkap pada konstanta!
Konstanta dapat disimbolkan dengan hurufb0 sering juga dituliskan

dengan huruf a, , atau juga0. Secara substansi penulisan itu mempunyai arti
yang sama, yaitu menunjukkan konstanta atau intercept yang merupakan sifat
bawaan dari variabel Y.Konstanta ini mempunyai angka yang bersifat tetap yang
sekaligus menunjukkan titik potong garis regresi padasumbu Y. Jika konstanta itu
bertanda positif maka titikpotongnya disebelah atas titik origin (0), sedang
bilabertanda negatif titik potongnya di sebelah bawah titikorigin. Nilai konstanta
ini merupakan nilai dari variabel Yketika variabel X bernilai nol. Atau dengan
bahasa yangmudah, nilai konstanta merupakan sifat bawaan dari Y.
Konstanta memberikan informasi tentang seberapa besar faktor-faktor
yang bersifat tetap mempengaruhi variabel Y, serta menjelaskan nilai variabel
terikat ketika masing-masing variabel bebasnya bernilai nol (0).

c. Jelaskan informasi apa yang dapat diungkap pada koefisien regresi!


Nilai koefisien regresi yang disimbolkan dengan huruf b berfungsi untuk
menentukan tingkat kemiringan garis regresi. Semakin rendah koefisien regresi,
maka derajat kemiringan garis regresi terhadap sumbu X semakin rendah pula.
Sebaliknya, semakin tinggi nilai b, maka derajat kemiringan garis regresi
terhadap sumbu X semakin tinggi. Koefisien regresi mencerminkantingkat
elastisitas variabel X (independen).

Pencarian nilai bpada single linier berbeda dengan multiple linier.


Perbedaan ini muncul karena jumlah variabel penjelasnya bertambah.
Semakin banyaknya variabel X ini makakemungkinan-kemungkinan yang
menjelaskan model juga mengalami pertambahan. Dalam single
linierkemungkinan perubahan variabel lain tidak terjadi, tetapidalam multiple
linier hal itu terjadi. Misalnya, Jika terjadiperubahan pada X1,meskipun X2
konstan, akan mampumerubah nilai harapan dari Y. Begitu pula, perubahanpada
X2, meskipun X1 konstan, akan mampu merubahnilai harapan dari Y. Perubahan
yang terjadi pada X1 atauX2 tentu mengakibatkan perubahan nilai harapan Y
atauE(Y/X1,X2) yang berbeda.

d. Coba sebutkan perbedaan-perbedaan antara model regresi linier sederhana


dengan model regresi linier berganda!
Regresi liner sederhana adalah regresilinier dengan 2 (dua) variabel (yaitu
variabel Y dan X). Pada RegresiLinier Berganda, jumlah variabel yang
digunakan akan ditambahmenjadi lebih banyak, yaitu satu variabel Y dan
jumlahvariabel X nya lebih dari 1 (satu) variabel. Artinya,variabel X bisa
berjumlah 2, 3, atau lebih.
Perubahan model dari bentuk single ke dalam bentukmultiple mengalami
beberapa perubahan, meliputi:
1) jumlah variabel penjelasnya bertambah, sehinggaspesifikasi model dan data
terjadi penambahan.
2) rumuspenghitungan nilai b mengalami perubahan,
3) jumlahdegree of freedom dalam menentukan nilai t juga berubah.

Penulisan model regresi linier berganda merupakanpengembangan dari


model regresi linier tunggal.Perbedaannya hanya terdapat pada jumlah variabel X
saja.Dalam regresi linier tunggal hanya satu X, tetapi dalamregresi linier
berganda variabel X lebih dari satu.Telah dikemukaan di atas bahwa pencarian
nilai bpada single linier berbeda dengan multiple linier.Perbedaan ini muncul
karena jumlah variabel penjelasnyabertambah. Semakin banyaknya variabel X ini
makakemungkinan-kemungkinan yang menjelaskan model juga mengalami
pertambahan. Dalam single linier kemungkinan perubahan variabel lain tidak
terjadi, tetapi dalam multiple linier hal itu terjadi.
e. Jelaskan mengapa rumus untuk mencari nilai b pada model regresi linier
berganda berbeda dengan model regresi linier sederhana!
Telah dikemukaan di atas bahwa pencarian nilai bpada single linier berbeda
dengan multiple linier.Perbedaan ini muncul karena jumlah variabel penjelasnya
bertambah. Semakin banyaknya variabel X ini makakemungkinan-kemungkinan
yang menjelaskan model juga mengalami pertambahan. Dalam single
linierkemungkinan perubahan variabel lain tidak terjadi, tetapidalam multiple
linier hal itu terjadi. Misalnya, Jika terjadiperubahan pada X1, meskipun X2
konstan, akan mampumerubah nilai harapan dari Y. Begitu pula, perubahanpada
X2, meskipun X1 konstan, akan mampu merubahnilai harapan dari Y. Perubahan
yang terjadi pada X1 atauX2 tentu mengakibatkan perubahan nilai harapan Y
atauE(Y/X1,X2) yang berbeda. Oleh karena itu pencarian nilaib mengalami
perubahan.

f. Coba jelaskan apakah pencarian nilai t juga mengalami perubahan! kenapa?


Setelah diketahui semua nilai standar error (Sb0, Sb1, Sb2)melalui penggunaan
rumus-rumus, maka nilai tuntuk masing-masing parameter dapat diperoleh,
karenanilai t merupakan hasil bagi antara b dengan Sb. Pencariannilai t
mempunyai kesamaan dengan model regresi liniersederhana, hanya saja
pencarian Sb nya yang berbeda.

g. Coba uraikan bagaimana menentukan nilai t yang signifikan!


Dengan diketahuinya nilai t hitung masing-masingparameter, maka dapat
digunakan untuk mengetahuisignifikan tidaknya variabel penjelas
dalammempengaruhi variabel terikat. Untuk dapat mengetahuiapakah signifikan
atau tidak nilai t hitung tersebut, makaperlu membandingkan dengan nilai t tabel.
Apabila nilai thitung lebih besar dibandingkan dengan nilai t tabel, makavariabel
penjelas tersebut signifikan. Sebaliknya, jika nilait hitung lebih kecil darit tabel,
maka variabel penjelastersebut tidak signifikan.

h. Jelaskan apa kegunaan nilai F!


Nilai F digunakan untuk pengujian signifikansi semua variabelpenjelas secara
serentak atau bersama-sama. Pengujiansecara serentak tersebut dilakukan dengan
teknik analisisof variance (ANOVA) melalui pengujian nilai F hitungyang
dibandingkan dengan nilai F tabel. Oleh karena itudisebut pula dengan uji F.Pada
prinsipnya, teknik ANOVA digunakan untukmenguji distribusi atau variansi
means dalam variabel penjelas apakah secara proporsional telah
signifikanmenjelaskan variasi dari variabel yang dijelaskan.

i. Bagaimana menentukan nilai F yang signifikan?


Perlu dihitung rasio antaravariansi means (variance between means)
yangdibandingkan dengan variansi di dalam kelompokvariabel (variance between
group). Hasil pembandingankeduanya itu (rasio antara variance between
meansterhadap variance between group) menghasilkan nilai Fhitung, yang
kemudian dibandingkan dengan nilai F tabel.
Jika nilai F hitung lebih besar dibanding nilai F tabel,maka secara
serentak seluruh variabel penjelas yang adadalam model signifikan
mempengaruhi variabel terikat Y.Sebaliknya, jika nilai F hitung lebih kecil
dibandingkandengan nilai F tabel, maka tidak secara serentak seluruhvariabel
penjelas yang ada dalam model signifikanmempengaruhi variabel terikat Y.

j. Jelaskan apakah rumus dalam mencari koefisien determinasi pada model regresi
linier berganda berbeda dengan regresi linier sederhana! kenapa?
Pengujian ini biasanya disimbolkan dengan koefisien regresi yang biasa
disimbolkan dengan R2. Uraian tentangkoefisien determinasi sedikit banyak telah
disinggungpada single linier regression. Pada sub bahasan ini hanyamenambah
penjelasan-penjelasan agar menjadi lebihlengkap saja.Koefisien determinasi pada
dasarnya digunakanuntuk mengkur goodness of fit dari persamaan regresi,melalui
hasil pengukuran dalam bentuk prosentase yangmenjelaskan determinasi variabel
penjelas (X) terhadapvariabel yang dijelaskan (Y). Koefisien determinasi
dapatdicari melalui hasil bagi dari total sum of square (TSS)atau total variasi Y
terhadap explained sum of square(ESS) atau variasi yang dijelaskan Y. Dengan
demikiankita dapat mendefinisikan lagi R2 dengan arti rasio antaravariasi yang
dijelaskan Y dengan total variasi Y.

Anda mungkin juga menyukai