Makalah Analisis Regresi Berganda 1
Makalah Analisis Regresi Berganda 1
Makalah Analisis Regresi Berganda 1
PENDAHULUAN
Analisa regresi berganda adalah salah satu metode statistika yang sering
digunakan untuk mengetahui sejauh mana ketergantungan dan hubungan sebuah
variabel tak bebas dengan sebuah atau lebih variabel bebas, bila dalam analisisnya
hanya melibatkan sebuah variabel bebas maka regresi linier sederhana. Sedangkan
bila dalam analisisnya melibatkan dua atau lebih variabel bebas maka analisis yang
digunakan adalah analisis linear berganda. Hubungan dan pengaruh dua variabel
tersebut bermanfaat untuk mengetahui kondisi atau dampak yang terjadi akibat
adanya perubahan suatu variabel terhadap variabel lainnya, sehingga dapat disusun
suatu rencana dalam menghadapi dampak tersebut Seringkali digunakan untuk
mengatasi permasalahan analisis regresi yang melibatkan hubungan dari dua atau
lebih variabel bebas. Maka dari itu, kami membuat makalah ini dengan judul “Analisis
Regresi Linear Berganda”
LANDASAN TEORI
Istilah regresi pertama kali diperkenalkan oleh Sir Francis Galton pada
tahun 1886. Galton menemukan adanya tendensi bahwa orang tua yang memiliki
tubuh tinggi memiliki anak-anak yang tinggi, orang tua yang pendek memiliki
anak-anak yang pendek pula. Kendati demikian. Ia mengamati bahwa ada
kecenderungan tinggi anak cenderung bergerak menuju rata-rata tinggi populasi
secara keseluruhan. Dengan kata lain, ketinggian anak yang amat tinggi atau orang
tua yang amat pendek cenderung bergerak kearah rata-rata tinggi populasi. Inilah
yang disebut hukum Golton mengenai regresi universal. Dalam bahasa galton, ia
menyebutkan sebagai regresi menuju mediokritas.
Dalam ilmu sosial (pendidikan) jarang terjadi adanya hubungan antara dua
variabel saja. Sebagian besar satu variabel mempunyai hubungan dengan banyak
variabel sehingga dalam analisis statistik pun hendaknya digunakan alat statistik
yang bisa mencakup hubungan banyak variabel. Apabila kita jumpai satu variabel
terikat yang dipengaruhi oleh beberapa variabel bebas dalam mempengaruhi
variabel terikat itu bermacam-macam, sehingga bentuk hubungannyapun
berbeda.
Dalam kajian ilmu sosial maupun kependidika sering terjad sifat hubungan
berjenjang. Ini berarti bahwa variabel bebas dalam mempengaruhi variabel
terikat tidak terjadi secara langsung, tetapi melalui variavel lain. Variabel lain
menjembatani pengaruh variabel bebas terhadap variabel terikat tersebut
dengan variabel antara. Disamping itu, antar variabel bebas itu sendiri
mempunyai pola hubungan yang tidak tetap artinya bisa benar-benar bebas,
berkorelasi tetapi tidak signifikan, mempunyai hubungan yang tidak erat.
Pola hubungan-hubungan regresi ganda yang akan dibahas pada makalah
ini diantaranya:
Apabila yang kita hadapi adala kondisi (pola) pertama, maka analisisnya
akan sederhana. Sebaliknya jika yang kita hadapi adalah pola yang kedua, maka
kita harus melihat besarnya kontribusi bersama maupun yang benar-benar
terpisah. Lain halnya jika tujuan kita tidak akan melihat kontribusi variabel bebas
terhadap variabel terika, tetapi hanya sekedar untuk melakukan prediksi atas
nilai variabel terikat dengan dasar variabel bebas. Tujuan yang terakhir ini kurang
mempunyai sumbangan dalam pengambilan kebijakan. Sebaiknya kita dapat
menggunakan analisis statistik (khususnya regresi ganda) semaksimal mungkin.
Semakin banyak variabel bebas yang dilibatkan dalam perhitungan (tentunya
sesuai dengan teori yang mendasari penelitian) semakin baik keputusan yang
dapat diambil.
BAB III
PEMBAHASAN
Analisis regresi adalah teknik statistika yang berguna untuk memeriksa dan
memodelkan hubungan diantara variabel-variabel. Penerapannya dapat dijumpai
secara luas di banyak bidang seperti teknik, ekonomi, manajemen, ilmu-ilmu biologi,
ilmu-ilmu sosial, dan ilmu-ilmu pertanian. Pada saat ini, analisis regresi berguna
dalam menelaah hubungan dua variabel atau lebih, dan terutama untuk menelusuri
pola hubungan yang modelnya belum diketahui dengan sempurna, sehingga dalam
penerapannya lebih bersifat eksploratif.
Analisis regresi dikelompokkan dari mulai yang paling sederhana sampai yang
paling rumit, tergantung tujuan yang berlandaskan pengetahuan atau teori
sementara, bukan asal ditentukan saja. jika dalam persamaan regresi hanya terdapat
satu variabel terikat,maka disebut sebagai regresi sederhana. Sedangkan jika variabel
bebasnya lebih dari satu, maka disebut sebagai persamaan regresi berganda
1. Asumsi Eksistensi
Untuk setiap kombinasi khusus nilai-nilai tetap dari variabel bebas (dasar)
distribusi peluang tertentu yang mempunyai nilai rata-rata dan variansi terhingga.
2. Asumsi Kebebasan
Nilai-nilai Y adalah hasil pengamatan yang bebas statistik antara satu dengan lainnya.
3. Asumsi kelinearan
Nilai rata-rata Y, untuk setiap kombinasi nilai khusus dari dan ditulis
Atau
4. Asumsi Kehomogenan
5. Asumsi Kenormalan
Asumsi ini tidak diperlukan untuk membuat model regresi akan tetapi umumnya
diperlukan untuk membuat inferensi.
1. Ukuran Sampel
Masalah berkenaan ukuran sampel di sini adalah generabilitas. Dengan
sampel kecil anda tidak bisa melakukan generalisasi (tidak bisa diulang) dengan
sampel lainnya. Berbeda penulis berbeda berapa sampel yang seharusnya dalam uji
Regresi Berganda. Stevens (1996, p.72) merekomendasikan bahwa “untuk penelitian
ilmu sosial, sekitar 15 sampel per prediktor (variabel bebas) dibutuhkan untuk
mengisi persamaan uji regresi.” Tabachnick and Fidell (1996, p.132) memberi rumus
guna menghitung sampel yang dibutuhkan uji Regresi, berkaitan dengan jumlah
variabel bebas yang digunakan:
n > 50 + 8m
Dimana :
n = Jumlah Sampel
m = Jumlah Variabel Bebas
Jika peneliti menggunakan 5 variabel bebas, maka jumlah sampel yang dibutuhkan
adalah 90 orang, dalam mana 50 ditambah ( 5 x 8) = 50 + 40 = 90.
2. Outlier
Regresi Berganda sangat sensitif terhadap Outlier (skor terlalu tinggi atau
terlalu rendah). Pengecekan terhadap skor-skor ekstrim seharusnya dilakukan
sebelum melakukan Regresi Berganda. Pengecekan ini dilakukan baik terhadap
variabel bebas maupun terikat. Outlier bisa dihapus dari data atau diberikan skor
untuk variabel tersebut yang tinggi, tetapi tidak terlampau beda dengan kelompok
skor lainnya. Prosedur tambahan guna mendeteksi outlier juga terdapat pada
program SPSS file mah_1. Outlier pada variabel terikat dapat diidentifikasi dari
Standardised Residual plot yang dapat disetting. Tabachnick and Fidell (1996, p. 139)
menentukan outlier adalah nilai-nilai Standardised Residual di atas 3,3 (atau < - 3,3).
Outlier juga bisa dicek menggunakan jarak Mahalanobis yang tidak diproduksi oleh
program Regresi Berganda SPSS ini. Ia tidak terdapat dalam output SPSS. Untuk
mengidentifikasi sampel mana yang merupakan Outlier, anda perlu menentukan nilai
kritis Chi Square, dengan menggunakan jumlah variabel bebas yang digunakan dalam
penelitian sebagai “degree of freedom-nya” atau derajat kebebasan. Pallant
menggunakan Alpha 0,001 agar lebih meyakinkan, yang rinciannya sebagai berikut:
3. Normalitas Residu
Normalitas adalah residu yang seharusnya terdistribusi normal seputar skor-
skor variabel terikat. Residu adalah sisa atau perbedaan hasil antara nilai data
pengamatan variabel terikat terhadap nilai variabel terikat hasil prediksi. Untuk
melihat apakah residu normal atau tidak, dapat dilakukan dengan cara berikut:
Melihat grafik Normal P-P Plot, dan
Uji Kolmogorov-Smirnov
Pada grafik Normal P-P Plot, residu yang normal adalah data memencar mengikuti
fungsi distribusi normal yaitu menyebar seiring garis z diagonal. Residu normal dari
uji Kolmogorov-Smirnov adalah diperolehnya nilai p > 0,05.
Linieritas adalah residual yang seharusnya punya hubungan dalam bentuk “straight-
line” dengan skor variabel terikat yang diprediksi. Homoskedastisitas adalah varians
residual seputar skor-skor variabel terikat yang diprediksi seharusnya sama bagi skor-
skor yang diprediksi secara keseluruhan.
4. Multikolinieritas
Uji Regresi mengasumsikan variabel-variabel bebas tidak memiliki hubungan
linier satu sama lain. Sebab, jika terjadi hubungan linier antarvariabel bebas akan
membuat prediksi atas variabel terikat menjadi bias karena terjadi masalah
hubungan di antara para variabel bebasnya.
Dalam Regresi Berganda dengan SPSS, masalah Multikolinieritas ini
ditunjukkan lewat tabel Coefficient, yaitu pada kolom Tolerance dan kolom VIF
(Variance Inflated Factors). Tolerance adalah indikator seberapa banyak variabilitas
sebuah variabel bebas tidak bisa dijelaskan oleh variabel bebas lainnya. Tolerance
dihitung dengan rumus 1 – R2 untuk setiap variabel bebas. Jika nilai Tolerance sangat
kecil (< 0,10), maka itu menandakan korelasi berganda satu variabel bebas sangat
tinggi dengan variabel bebas lainnya dan mengindikasikan Multikolinieritas. Nilai VIF
merupakan invers dari nilai Tolerance (1 dibagi Tolerance). Jika nilai VIF > 10, maka itu
mengindikasikan terjadinya Multikolinieritas.
5. Autokorelasi
Autokorelasi juga disebut Independent Errors. Regresi Berganda
mengasumsikan residu observasi seharusnya tidak berkorelasi (atau bebas). Asumsi
ini bisa diuji dengan teknik statistik Durbin-Watson, yang menyelidiki korelasi
berlanjut antar error (kesalahan). Durbin-Watson menguji apakah residual yang
berdekatan saling berkorelasi. Statistik pengujian bervariasi antara 0 hingga 4 dengan
nilai 2 mengindikasikan residu tidak berkorelasi. Nilai > 2 mengindikasikan korelasi
negatif antar residu, di mana nilai < 2 mengindikasikan korelasi positif. >
Cara melakukan uji Durbin-Watson adalah, nilai Durbin-Watson hitung harus lebih
besar dari batas atas Durbin-Watson tabel. Syarat untuk mencari Durbin-Watson
tabel adalah Tabel Durbin-Watson. Untuk mencari nilai Durbin-Watson tabel:
1. Terima H0 jika Durbin-Watson hitung lebih besar dari ..... dan Durbin-Watson
hitung lebih kecil dari 4 - .....; Artinya tidak ada Autokorelasi.
2. Tolak H0 jika Durbin-Watson hitung lebih kecil dari ..... atau 4 - ..... lebih kecil
dari .....; Artinya ada Autokorelasi.
6. Homoskedastisitas
Uji Regresi bisa dilakukan jika data bersifat Homoskedastisitas bukan
Heteroskedastisitas. Homoskedastisitas adalah kondisi dalam mana varians dari data
adalah sama pada seluruh pengamatan. Terdapat sejumlah uji guna mendeteksi
gejala heteroskedastisitas misalnya uji Goldfeld-Quandt dan Park. Namun, Wang and
Jain beranggapan bahwa Uji Park dapat lebih teliti dalam memantau gejala
heteroskedastisitas ini. Dengan demikian, penelitian ini akan menggunakan Uji Park
guna menentukan gejala heteroskedastisitas variabel-variabelnya.
Uji Park dilakukan dengan meregresikan nilai residual (Lne2) dengan masing-masing
variabel independent. “The Park test suggests that if heteroscedasticity is present,
the heteroscedastic varianc eσ_i^2 may be systematically related to one or more of
the explanatory variables.” Rumus uji Park sebagai berikut:
1 Dengan SPSS klik Analyze -->Regression --> Linear --> Masukkan variabel y ke
Dependent --> Masukkan variabel x1, x2, x3, x4 ke Independent(s) --> Klik Save -->
Pada Residual klik Unstandardized --> Continue --> OK
2 Pada SPSS klik Data View --> Cek bahwa ada satu variabel baru bernama res_1. Ini
merupakan nilai ε_i^ . Nilai ini harus dikuadratkan dengan cara (pada SPSS) klik
Transform --> Compute --> Isi Target Variable dengan ε_i^2 --> Pada operasi hitung
kalikan nilai ε_i^ dengan ε_i^ . Pada Variable View SPSS muncul variabel baru
bernama ε_i^2.
3 Dengan SPSS, tepatnya menu Transform --> Compute lakukan perubahan nilai
ε_i^2, X1, X2, X3, X4 ke dalam bentuk logaritma natural (Ln) [caranya dengan Klik
Ln lalu pindahkan variabel] Ln(ε_i^2 ) yaitu regresi unstandardized residual pada
Target Variable dinamai Lnei2; X1 yaitu variabel x1 pada Target Variable dinamai
Lnx1; X2 yaitu variabel x2 pada Target Variable dinamai Lnx2; x3 yaitu variabel x3
pada Target Variable dinamai Lnx3; x4 yaitu variabel x4 pada Target Variable
dinamai Lnx4.
4 Setelah diperoleh nilai variabel-variabel baru Lnei2, LnX1, LnX2, LnX3, dan LnX4.
5 Lakukan uji regresi kembali secara satu per satu.
6 Pertama, klik Analyze --> Regression>Linear --> Masukkan variabel Lnei2 ke kotak
Dependent --> Masukkan variabel LnX1 ke Independent(s) --> OK. Sementara hasil
belum dihiraukan.
7 Kedua, klik Analyze --> Regression --> Linear --> Variabel Lnei2 masih ada di
Dependent, biarkan > Keluarkan LnX1 dan masukkan LnX2 ke Independent(s) >
OK. Sementara hasil belum dihiraukan.
8 Ketiga, klik Analyze --> Regression --> Linear --> Variabel Lnei2 masih ada di
Dependent, biarkan > Keluarkan LnX2 dan masukkan LnX3 ke Independent(s) >
OK. Sementara hasil belum dihiraukan.
9 Keempat, klik Analyze --> Regression --> Linear --> Variabel Lnei2 masih ada di
Dependent, biarkan > Keluarkan LnX3 dan masukkan LnX4 ke Independent(s) >
OK. Sementara hasil belum dihiraukan.
10 Perhatikan Output SPSS. Pada output, terdapat hasil perhitungan Park bagi
variabel x1, x2, x3 dan x4, tepatnya adalah hasil uji Lnei2 dengan LnX1, dan uji
Lnei2 dengan LnX2, uji Lnei2 dengan LnX3, dan uji Lnei2 dengan LnX4.
11 Peneliti akan memperbandingkan apa yang tertera di tabel Coefficients, yaitu
nilai t.
12 Guna memastikan apakah ada gejala heteroskedastisitas, peneliti akan
memperbandingkan nilai thitung dengan ttabel. Nilai ttabel dapat dicari pada
Tabel t, yaitu dengan menentukan df = n - 4 . n adalah jumlah sampel dan 4
karena jumlah variabel independen penelitian adalah 4. Sehingga nilai df = 48 – 4
= 44. Dalam taraf 0,05 uji yang dilakukan adalah 2 sisi sehingga singnifikansi pada
tabel adalah 0,025.
Dengan mempertemukan nilai 46 dan 0,025 dan uji 2 sisi pada taraf 95% (0,025)
pada Tabel t diperoleh nilai t tabel penelitian sebesar ......
Hipotesis yang diajukan mengenai masalah homoskedastisitas ini sebagai berikut:
Caranya dengan melihat grafik persilangan SRESID dengan ZPRED pada output hasil
SPSS. Caranya sebagai berikut:
Homoskedastisitas terjadi jika tidak terdapat pola tertentu yang jelas, serta titik-titik
menyebar di atas dan di bawah angka 0 pada sumbu Y. Heteroskedastisitas terjadi
jika terdapat titik-titik memili pola tertentu yang teratur seperti bergelombang,
melebar kemudian menyempit.
Setelah uji Regresi Berganda selesai dilakukan, peneliti harus melakukan interpretasi.
Rumus Regresi Berganda (standar) adalah sebagai berikut:
Setelah pengujian Regresi Berganda dengan SPSS selesai, hal-hal penting untuk
interpretasi adalah apa yang tercantum pada tabel-tabel pada output SPSS.
Tabel Descriptives
Pada tabel Descriptive dapat dilihat nilai Standar Deviasi. Nilai ini terdapat
pada kolom Std. Deviation. Nilai ini nanti akan diperbandingkan dengan nilai Std.
Error of the Estimate.
Kolom Model. Menunjukkan berapa buah model analisis yang kita bentuk.
Kalikan Adjusted R2 dengan 100% maka akan diperoleh berapa % varians tiap sampel
pada variabel terikat bisa diprediksi oleh variabel-variabel bebas secara bersama-
sama (simultan).
Std. Error of the Estimate. Kolom ini menjelaskan seberapa kuat variabel-variabel
bebas bisa memprediksi variabel terikat. Nilai Std. Error of the Estimate
diperbandingkan dengan nilai Std. Deviation (bisa dilihat pada tabel Descriptives).
Jika Std. Error of the Estimate < Std. Deviation, maka Std. Error of the Estimate baik
untuk dijadikan prediktor dalam menentukan variabel terikat. Jika Std. Error of the
Estimate > Std. Deviation, maka Std. Error of the Estimate tidak baik untuk dijadikan
prediktor dalam mementukan variabel terikat.
Tabel Coefficients
Pada tabel Coefficient, mohon perhatikan lalu jelaskan nilai-nilai yang tertera
pada kolom-kolom berikut ini:
Model. Kolom ini menjelaskan berapa banyak model analisis yang dibuat peneliti.
Pada kolom ini juga terdapat nama-nama variabel bebas yang digunakan dalam
penelitian. Variabel-variabel tersebut diberi label “Constant” yaitu nilai konstanta
yang digunakan dalam persamaan uji Regresi Berganda (a).
Unstandardized Coefficient. Kolom ini terdiri atas b dan Std. Error. Kolom b
menunjukkan Koefisien b, yaitu nilai yang menjelaskan bahwa Y (variabel terikat)
akan berubah jika X (variabel bebas) diubah 1 unit.
Sig. Kolom ini menjelaskan tentang signifikansi hubungan antar variabel bebas
dengan variabel terikat. Nilai Sig. ini sebaiknya adalah di bawah 0,05 (signifikansi
penelitian).
Tolerance. Kolom ini menjelaskan banyaknya varians pada suatu variabel yang tidak
bisa dijelaskan oleh variabel prediktor lainnya. Kisarannya 0 hingga 1, di mana
semakin mendekati 1 maka semakin mengindikasikan prediktor-prediktor lain tidak
bisa menjelaskan varians di variabel termaksud. Nilai yang semakin mendekati 0
artinya hampir semua varians di dalam variabel bisa dijelaskan oleh variabel
prediktor lain. Nilai Torelance sebaiknya ada di antara 0,10 hingga 1.
Tabel ANOVA
Sig. Tabel ANOVA menunjukkan besarnya angka probabilitas atau signifikansi
pada perhitungan ANOVA. Nilai yang tertera digunakan untuk uji kelayanan Model
Analisis [dimana sejumlah variabel x mempengaruhi variabel y] dengan ketentuan
angka probabilitas yang baik untuk digunakan sebagai model regresi harus < 0,05.
Nilai ini bisa dilihat pada kolom Sig. Jika Sig. < 0,05, maka Model Analisis dianggap
layak. Jika Sig. > 0,05, maka Model Analisis dianggap tidak layak.
Pada tabel ANOVA terdapat kolom F. Nilai yang tertera pada kolom F tersebut disebut
sebagai F hitung. F hitung ini diperbandingkan dengan F tabel. Peraturannya:
Persoalannya, bagaimana menentukan F tabel? F tabel dapat ditentukan dengan
cara:
Koefisien Determinasi
Dalam uji Regresi Berganda, Koefisien Determinasi digunakan untuk
mengetahui persentase sumbangan pengaruh serentak variabel-variabel bebas
terhadap variabel terikat. Untuk itu, digunakan angka-angka yang ada pada Tabel
Model Summary.
Pada Tabel Coefficient, pengujian Hipotesis akan dilakukan. Uji hipotesis dilakukan
dengan menggunakan Uji t. Pernyataan Hipotesis yang hendak diuji sebagai berikut:
Nilai t hitung bisa dilihat pada kolom t bagi masing-masing variabel bebas.
DATA
Data diatas akan dilakukan analisis regresi berganda dengan bantuan sofware
SPSS 17 menggunakan tingkat signifikansi 0,05 dengan hasil pengolahan data
sebagai berikut:
Variables Entered/Removed
Variables Variables
Model Entered Removed Method
x2, x1a.
Model Summaryb
Model R R Adj
Squa ust
re ed
R
Sq
uar
e
b. Dependent Variable: y
Sum of SquaresdfMean
SquareFSig.1Regression188.434294.21711.087.004 aResidual76.48398.498Total
264.91711a. Predictors: (Constant), x2, x1ANOVA b
Model
b0 : 1.939
b1 : 0,423
b2 : 0,886
BAB IV
PENUTUP
Kesimpulan
1. Regresi linier ganda (Multivariate Linear Regression) adalah analisis yang
dilakukan apabila satu variabel dependen Y perlu dijelaskan oleh lebih dari satu
variabel independen X.
2. Pengujian keberartian persamaan regresi ganda menggunakan F tes dan
pengujian koefisien regresi menggunakan t tes.
3. Untuk mengetahui besarnya kontribusi variabel bebas terhadap variabel
terikatnya diperlukan perhitungan koefisien korelasi.
4. Untuk mengetahui besarnya kontribusi masing-masing variabel bebas terhadap
variabel terikat dengan mempertimbangkan hubungan variabel bebas lainnya,
baik terhadap variabel terikat maupun variabel bebas yang dicari kontribusinya,.