Kelas : II A
Mata Kuliah : Biostatistik
Dosen Pembimbing : Wulan Anggraini, SKM., MKM.
Y = a + bx
Ketika berhadapan pada kondisi ilmu sosial,ada kemungkinan terjadi kesalahan atau
penyimpangan (tidak eksak) pada hubungan antarvariabel,artinya untuk beberapa nilai X
yang sama kemungkinan diperoleh nilai Y yang berbeda.Misalnya,pada hubungan berat
badan dengan tekanan darah,tidak setiap orang yang berat badannya sama memiliki ilmu
sosial atau kesehatan masyarakat tidak eksak,persamaan garis yang dibentuk menjadi :
Y = a + bx + e
Ket :
Y = Variabel Dependen
X = Variabel Independen
a = Intercept, perbedaan besarnya rata-rat variabel Y ketika variabel X = 0
b = Slope, perkiraan besarnya peubahan nilai variabel Y bila nilai variabel X berubah satu
unit pengukuran
e = nilai kesalahan (error) yaitu selisih antara nilai Y individual yang teramati dengan nilai Y
yang sesungguhnya pada titik X tertentu
Regresi linear digunakan apabila kita hendak mengetahui hubungan satu variabel terikat
yang mempunyai skala pengukuran numerik dengan satu atau lebih variabel bebas.Ada
beberapa syarat regresi linear,namun syarat terpenting adalah syarat linear.Linear dapat
berupa linear yang arahnya positif dan arah negatif.Linear positif artinya semakin meningkat
nilai variabel bebas (x),semakin meningkat nilai variabel terikat (y).Sementara itu,linear
negatif artinya semakin meningkat nilai variabel bebas (x),semakin menurun nilai variabel
terikat (y). (Dahlan Sopiyudin,2012)
B. Syarat dan Asumsi Regresi Linier Berganda
a. Syarat Regresi Linier Berganda
Sumber syarat syarat pembuktian Kriteria
Residu Sebaran normal Grafik histogram Grafik kurva normal
Plot Plot kurva normal
Uji normalitas p > 0,05
Rerata nol Deskriptif Rerata residu = nol
Tidak ada outlier Case wise Tidak ada data diluar -3
Diagnostic simpang baku dan 3
Simpang baku
Konstan Grafik scatter antara Konstan,tidak membentuk
Residu dengan pola tertentu
Variabel bebas
Independen Durbin-Watson Nilai DW sekitar angka 2
Variabel bebas Tidak ada autokor Uji korelasi pearson Korelasi lebih kecil dari 0,9
elasi(multikolinieriti) Uji toleransi Toleransi lebih besar dari 0,4
Variabel terikat- Linier Grafik scatter Terdapat kesan linier
Variabel bebas antara variabel
bebas dengan vari
abel terikat
Asumsi klasik pada regresi linear berganda antara lain: Data interval atau rasio, linearitas,
normalitas, non outlier, homoskedastisitas, non multikolinearitas dan non autokorelasi.
Skala data semua variable terutama variable terikat adalah interval atau rasio. Asumsi ini
tidak perlu diuji, cukup anda pastikan bahwa data yang digunakan adalah data interval atau
rasio (numeric atau kuantitatif).
2) Linearitas
Ada hubungan linear antara variable bebas dengan variable terikat. Asumsi linearitas diuji
dengan uji linearitas regresi, misalnya dengan kurva estimasi.
Dengan kurva estimasi kita bisa tentukan ada hubungan linear atau tidak dengan melihat nilai
p value linearitas. Jika p value < 0,05 maka terdapat hubungan yang linear antara predictor
dan response.
3) Normalitas Residual
Residual adalah beda antara y dengan y prediksi. Y adalah variable terikat, sedangkan y
prediksi adalah Y hasil persamaan regresi yang dibuat. Sehingga residual dibangun dengan
rumus: y – y prediksi.
4) Non Outlier
Outlier disebut dengan data pencilan atau data yang nilainya extreme atau lain dari pada
yang lainnya. Batasan outlier atau tidak bisa dilihat dari nilai absolut studentized residual.
Jika absolut studentized residual > 3 maka sampel atau observasi yang dimaksud menjadi
outlier.
5) Homoskedastisitas
Homoskedastisitas adalah sebuah kondisi dimana varians dari error bersifat konstan atau
tetap. Dengan kata lain bahwa varians dari error bersifat identic untuk setiap pengamatan.
6) Non Multikolinearitas
Multikolinearitas adalah keadaan dimana terdapat interkorelasi atau korelasi kuat antar
variable bebas di dalam model. Dinyatakan ada interkorelasi jika korelasi antar variable
bebas di dalam model regresi linear berganda > 0,8. Beberapa pakar menggunakan batasan
lebih dari 0,9.
Berdasarkan uraian diatas, maka jelas sekali bahwa asumsi multikolinearitas hanya ada dalam
regresi linear berganda dan tidak ada pada regresi linear sederhana. Sebab pada regresi linear
berganda ada lebih dari satu vriabel bebas, sedangkan pada regresi linear sederhana hanya
ada satu variable bebas.
7) Non Autokorelasi
Autokorelasi dapat diartikan bahwa terdapat korelasi antar waktu. Sehingga bisa diartikan
dengan mudah bahwa autokorelasi ini sering terjadi pada regresi linear berganda dengan data
time series atau runtun waktu. Dan jarang sekali terjadi pada data cross section. (Dahlan
Sopiyudin 2012)
Keterangan:
Y’ = Variabel dependen (nilai yang diprediksikan)
X1 dan X2 = Variabel independen
a = Konstanta (nilai Y’ apabila X1, X2…..Xn = 0)
b = Koefisien regresi (nilai peningkatan ataupun penurunan)
u Contoh Soal :
Misalnya kita akan membahas hubungan antara kompetensi (x 1) dan kompetensi (x2) dengan
kinerja pegawai (y).Untuk tujuan itu maka kita ambil sampel acak sebagai berikut :
No subyek Y X1 X2
1 6 12 10
2 7 14 11
3 8 10 14
4 8 16 13
5 9 18 15
6 10 24 20
7 5 12 8
8 12 30 16
9 6 10 12
10 7 6 9
Tentukan persamaan regresi ganda Y atas X1 dan X2
Penyelesaian :
No subyek Y X1 X2 X1Y X2Y X1X2 X12 X22
1 6 12 10 72 60 120 144 100
2 7 14 11 98 77 154 196 121
3 8 10 14 80 112 140 100 196
4 8 16 13 128 104 208 256 169
5 9 18 15 162 135 270 324 225
6 10 24 20 240 200 480 576 400
7 5 12 8 60 40 96 144 64
8 12 30 16 360 192 480 900 256
9 6 10 12 60 72 120 100 144
10 7 6 9 112 63 144 256 81
Jumlah 78 162 128 1372 1055 2212 2996 1756
Y = a0n + a1 X1 + a2 X2
78 = 10 a0 + 162a1 + 128a2...persamaan I
J YX1 = a0 X1 + a1 X12 + a2 X1X2
1372 = 162 ao + 2996 a1 + 2212 a2...persamaan II
YX2 = a0 X2 + a1 X1X2 + a2 X22
1055 = 128 a0 + 2212 a1 +175 a2...persamaan III
Persamaan III
1055 = 128 a0 + 2212 a1 +175 a2
1055 = 128 (7,8 – 16,2 a1 – 12,8 a2 ) + 2212 a1 + 1756 a2
1055 = 998,4 – 2073,6 a1 – 1638,4 a2 + 2212 a1 + 1756 a2
56,6 = 138,4 a1 + 117,6 a2...Persamaan V
Kesimpulan
Regresi berganda adalah model regresi atau prediksi yang melibatkan lebih dari satu
variabel bebas atau prediktor. Istilah regresi berganda dapat disebut juga dengan istilah
multiple regression. Kata multiple berarti jamak atau lebih dari satu variabel. Regresi linear
adalah alat statistik yang dipergunakan untuk mengetahui pengaruh antara satu atau beberapa
variabel terhadap satu buah variabel. Variabel yang mempengaruhi sering disebut variabel
bebas, variabel independen atau variabel penjelas.
Keterangan:
Y’ = Variabel dependen (nilai yang diprediksikan)
X1 dan X2 = Variabel independen
a = Konstanta (nilai Y’ apabila X1, X2…..Xn = 0)
b = Koefisien regresi (nilai peningkatan ataupun penurunan)
N
Daftar Pustaka