Analisis regresi dipakai untuk mengestimasi koefisien-koefisien dari persamaan garis lurus yang melibatkan satu variabel independen atau lebih yang paling baik untuk memprediksi nilai dari variabel dependen. Penjualan tahunan dari para penjual atau para wiraniaga dapat diprediksi dari variabel-variabel independen seperti usia, tingkat pendidikan, dan pengalaman. Analisis regresi dapat berdasar atas model hubungan dari variabel-variabel ini. Suatu model yang baik dapat dipakai untuk memprediksi penjualan tahunan tadi.
Analisis regresi dapat mencakup statistik yaitu jumlah kasus yang valid untuk tiap variabel, rata-rata, dan deviasi standar. Tiap model regresi dapat mencakup koefisien-koefisien, matriks korelasi, korelasi parsial, koefisien korelasi jamak, koefisien determinasi jamak, koefisien determinasi jamak disesuaikan, kesalahan standar dari estimasi, analisis tabel varians, nilai-nilai yang diprediksi, residual-residual, 95% confidence interval untuk tiap koefisien regresi, matriks varians-kovarians, Variance Inflation Factor (VIF), tolerance, pengujian Durbin-Watson, ukuran-ukuran jarak (Mahalanobis, Cook, dan nilai-nilai leverage), DfBeta, DfFit, interval-interval prediksi, casewise diagnostic, plots termasuk scatterplots, partial plots, histogram, dan normal probability plots.
Data
Data untuk variabel dependen dan variabel-variabel independen harus berjenis kuantitatif. Variabel-variabel kategorikal seperti agama, Program Studi, atau wilayah dari penduduk, perlu dicatat ke dalam variabel-variabel berbentuk bilangan biner (dummy) atau jenis-jenis variabel lain karena variabel-variabel tersebut merupakan variabel-variabel berjenis nominal. Variabel-variabel karegorikal juga mencakup variabel-variabel berjenis ordinal. Analisis regresi dapat dikelompokkan ke dalam analisis regresi berjenis scale dan analisis regresi berjenis kategorikal. 2
Regresi kategorikal memakai data kategorikal yang telah dikuantitatifkan dengan cara memakai nilai-nilai numerik pada kategori-kategori yang menghasilkan suatu persamaan regresi optimal untuk variabel-variabel yang telah mengalami transformasi. Analisis regresi linier standar melibatkan usaha meminimalkan jumlah dikuadratkan atas perbedaan- perbedaan antara variabel dependen dan variabel-variabel independen.
Asumsi-asumsi
Distribusi dari nilai variabel dependen memenuhi persyaratan normalitas distribusi data untuk tiap nilai variabel independen. Varians dari distribusi dari variabel dependen harus konstan untuk semua nilai dari variabel independen. Hubungan antara variabel dependen dan tiap variabel independen harus berbentuk garis lurus dan semua observasi harus independen.
Suliyanto telah membahas mengenai Analisis Regresi Berganda. Suliyanto menyajikan contoh kasus : Seorang peneliti akan meneliti apakah ada pengaruh harga dan pendapatan terhadap konsumsi buah Duren. Untuk keperluan tersebut diambil sampel secara acak sebanyak 10 rumah tangga.[1] Data Suliyanto memakai data sebagai berikut :
R 2 = 0.875, R disesuaikan = 0.840, Standard Error of estimate = 1.1818, F-hitung = 24.567, dan Y = 2,5529 -1,0921X 1 +1,9608X 2 +
Deskripsi Data
3
Suliyanto tidak menyajikan deskripsi data dan grafik histogram dengan kurva normal. Deskripsi data mencakup persentil, Dispersi, Distribusi, dan kecenderungan sentral. Grafik histogram dengan kurva normal mencakup histogram dengan kurva normal dari variabel Y, X1, dan variabel X2. Deskripsi data dan grafik histogram dengan kurva normal berfungsi mendeskripsikan dan meringkas data. Deskripsi data dan grafik histogram dengan kurva normal adalah sebagai berikut :
Statistics X1 X2 Y N Valid 10 10 10 Missing 0 0 0 Mean 4.00 4.70 7.40 Std. Error of Mean .471 .423 .933 Median 4.00 4.50 8.00 Mode 2 a 4 9 Std. Deviation 1.491 1.337 2.951 Variance 2.222 1.789 8.711 Skewness .000 .334 .255 Std. Error of Skewness .687 .687 .687 Kurtosis -1.334 -.852 .115 Std. Error of Kurtosis 1.334 1.334 1.334 Range 4 4 10 Minimum 2 3 3 Maximum 6 7 13 Percentiles 5 2.00 3.00 3.00 10 2.00 3.00 3.10 20 2.20 3.20 4.20 25 2.75 3.75 4.75 30 3.00 4.00 5.30 40 3.40 4.00 6.80 50 4.00 4.50 8.00 60 4.60 5.00 8.60 70 5.00 5.70 9.00 75 5.25 6.00 9.00 80 5.80 6.00 9.00 90 6.00 6.90 12.60 100 6.00 7.00 13.00 a. Multiple modes exist. The smallest value is shown
Histogram dengan Kurva Normal adalah sebagai berikut : 4
5
Pengujian Persyaratan Analisis Pengujian persyaratan analisis mencakup pengujian normalitas distribusi data dan pengujian homogenitas varians. Pengujian normalitas distribusi data menghasilkan informasi sebagai berikut :
Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. Y .194 10 .200 * .945 10 .611 X1 .149 10 .200 * .918 10 .341 X2 .200 10 .200 * .932 10 .466 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction
Nilai signifikansi Kolmogorov-Smirnov adalah 0.200 untuk variabel Y, 0.200 untuk variabel X1, dan 0.200 untuk variabel X2. Nilai-nilai ini adalah lebih besar daripada nilai 0.05 sehingga persyaratan normalitas distribusi data terpenuhi. Pengujian homogenitas varians menghasilkan informasi sebagai berikut :
6
Test of Homogeneity of Variances Y Levene Statistic df1 df2 Sig. 4925120699760122.000 4 5 .000
Signifikansi adalah 0.000. Nilai ini adalah lebih kecil daripada nilai 0.05 sehingga persyaratan homogenitas varians dari variabel Y dan X1 adalah tidak terpenuhi.
Test of Homogeneity of Variances Y Levene Statistic df1 df2 Sig. 3.993 3 5 .085
Signifikansi adalah 0.085. Nilai ini adalah lebih besar daripada nilai 0.05 sehingga persyaratan homogenitas varians dari variabel Y dan X2 adalah terpenuhi.
Hal ini berarti bahwa jumlah kasus hanya 10 kasus. Jumlah kasus minimal yaitu 30 kasus tidak terpenuhi dan homogenitas varians antara Y dan X1 juga tidak terpenuhi. Hal ini berarti bahwa pemakaian statistik parametrik adalah salah dan seharusnya statistik nonparametrik dipakai. Pemakaian statistik nonparametrik berarti bahwa judul penelitian yaitu Pengaruh pendapatan dan harga terhadap konsumsi buah Duren tidak dapat dipakai karena persamaan regresi tidak dapat disajikan jika Spearman Rho dipakai.
Pembahasan di bawah ini tidak memperhatikan dahulu persyaratan-persyaratan tersebut di atas untuk mengungkap kelemahan-kelemahan dari pembahasan yang dilakukan oleh Suliyanto.
Analisis Regresi Sederhana
Analisis regresi sederhana menghasilkan informasi sebagai berikut :
Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .354 a .125 .016 2.928 a. Predictors: (Constant), X1
7
Koefisien korelasi sederhana antara X1 dan Y adalah 0.354. Hal ini berarti bahwa hubungan antara X1 dan Y adalah lemah. Koefisien determinasi adalah 0.125 atau 12.5%. Hal ini berarti bahwa pengaruh langsung dari variabel X1 terhadap variabel Y adalah 12.5% dan sisanya sebesar 87.5% merupakan pengaruh tidak langsung dari variabel-variabel di luar penelitian ini. Koefisien determinasi disesualkan adalah 0.016 atau 1.6%. Kesalahan standar dari estimasi adalah 2.928. ANOVA a
Model Sum of Squares df Mean Square F Sig. 1 Regression 9.800 1 9.800 1.143 .316 b
Residual 68.600 8 8.575
Total 78.400 9
a. Dependent Variable: Y b. Predictors: (Constant), X1
Tabel Anova di atas mengandung informasi bahwa F-hitung dengan derajat kebebasan 1 dan adalah 1.143 dan F-tabel dengan derajat kebebasan 1 dan 8 adalah 5.317655. Hal ini berarti bahwa F-hitung adalah lebih kecil daripada F-tabel sehingga persamaan regresi adalah tidak baik atau tidak cocok atau tidak signifikan.
Coefficients a
Model Unstandardized Coefficients Standardized Coefficients t Sig. Fraction Missing Info. B Std. Error Beta 1 (Constant) 10.200 2.778 3.672 .006 X1 -.700 .655 -.354 -1.069 .316
Persamaan regresi sederhana adalah Y= 10.200 0.700X1. Hal ini berarti bahwa koefisien regresi adalah 0.7. Hal ini berarti bahwa pengaruh total dari variabel X1 terhadap variabel Y adalah -0.7. Hubungan ini berbentuk hubungan negatif dengan pengertian bahwa kenaikan pada X1 akan menurunkan Y dan penurunan pada X1 akan meningkatkan Y.
ANOVA Table Sum of Squares df Mean Square F Y * X1 Between Groups (Combined) 18.400 4 4.600 .383 Linearity 9.800 1 9.800 .817 Deviation from Linearity 8.600 3 2.867 .239 Within Groups 60.000 5 12.000 Total 78.400 9 8
F-hitung dengan derajat kebebasan 3 dan 5 adalah 0.239. F-tabel dengan derajat kebebasan 3 dan 5 adalah 5.409451. Hal ini berarti bahwa F-hitung adalah lebih kecil daripada F-tabel sehingga persamaan regresi memenuhi persyaratan linieritas persamaan regresi. Hal ini dapat disajikan dalam grafik sebagai berikut :
Persamaan regresi antara X2 dan Y adalah sebagai berikut :
Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .766 a .586 .534 2.014 a. Predictors: (Constant), X2
Koefisien korelasi antara X2 dan Y adalah 0.766. Hal ini berarti bahwa hubungan antara variabel X2 dan variabel Y adalah sangat kuat. Koefisien determinasi adalah 0.586 atau 58.6%. Hal ini berarti bahwa pengaruh langsung dari variabel X2 terhadap variabel Y adalah 58.6% dan pengaruh tidak langsung adalah 41.4%. Kesalahan standar dari estimasi adalah 2.014.
ANOVA a
Model Sum of Squares df Mean Square F Sig. 1 Regression 45.953 1 45.953 11.330 .010 b
Residual 32.447 8 4.056
Total 78.400 9
a. Dependent Variable: Y b. Predictors: (Constant), X2 9
Tabel Anova mengandung informasi bahwa F-hitung adalah 11.330 dengan derajat kebebasan 1 dan 8. F-tabel dengan derajat kebebasan 1 dan 8 adalah 5.317655. Hal ini berarti bahwa F-hitung adalah lebih besar daripada F-tabel sehingga persamaan regresi adalah signifikan.
Coefficients a
Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) -0.54 2.443
-0.221 0.831 X2 1.689 0.502 0.766 3.366 0.01 a. Dependent Variable: Y Persamaan regresi adalah Y = -0.54 + 1.689X2. Hal ini berarti bahwa koefisien regresi adalah 1.689 dengan pengertian perubahan satu skor pada variabel X2 akan mengakibatkan perubahan pada variabel Y sebesar 1.689. Pengaruh total adalah 1.689 yang terdiri dari 58.6% dari 1.689 merupakan pengaruh langsung dan 41.4% merupakan pengaruh tidak langsung.
ANOVA Table Sum of Squares df Mean Square F Y * X2 Between Groups (Combined) 55.900 4 13.975 3.106 Linearity 45.953 1 45.953 10.212 Deviation from Linearity 9.947 3 3.316 .737 Within Groups 22.500 5 4.500 Total 78.400 9
Pengujian linieritas persamaan regresi menghasilkan F-hitung adalah 0.737 dengan derajat kebebasan 3 dan 5. F-tabel dengan derajat kebebasan 3 dan 5 adalah 5.409451. Hal ini berarti bahwa F-hitung adalah lebih kecil daripada F-tabel sehingga persamaan regresi memenuhi persyaratan linieritas persamaan regresi. Hal ini dapat disajikan dalam grafik sebagai berikut :
10
Analisis Regresi Jamak
Model Summary b
Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .936 a .875 .840 1.182 3.386 a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
Analisis regresi jamak menghasilkan koefisien korelasi antara variabel X1, X2, dan variabel Y adalah 0.936. Hal ini berarti bahwa hubungan antara variabel-variabel ini adalah sangat kuat. Koefisien determinasi jamak adalah 0.875 atau 87.5%. Pengaruh lansung dari variabel X1 dan X2 terhadap variabel Y adalah 87.5% dan pengaruh tidak langsung dari variabel- variabel di luar variabel-variabel yang diteliti adalah 12.5%. Kesalahan standar dari estimasi adalah 1.182. Durbin-Watson adalah 3.386. Du dengan jumlah kasus sebanyak 8 dan k adalah 2 menunjukkan nilai sebesar 1.78 dan dl adalah 4-1.78 atau 2.22. Hal ini berarti bahwa autokorelasi terdapat antara variabel X1 dan variabel X2. 11
ANOVA a
Model Sum of Squares df Mean Square F Sig. 1 Regression 68.624 2 34.312 24.567 .001 b
Residual 9.776 7 1.397
Total 78.400 9
a. Dependent Variable: Y b. Predictors: (Constant), X2, X1
Tabel Anova mengandung informasi bahwa F-hitung adalah 24.567 dengan derajat kebebasan 2 dan 7. F-tabel dengan derajat kebebasan 2 dan 7 adalah 5.143253. Hal ini berarti bahwa F-hitung adalah lebih besar daripada F-tabel sehingga persamaan regresi jamak adalah signifikan.
Coefficients a
Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) 2.553 1.626 1.570 .160 X1 -1.092 .271 -.552 -4.029 .005 .950 1.052 X2 1.961 .302 .889 6.490 .000 .950 1.052 a. Dependent Variable: Y
Persamaan regresi jamak adalah Y = 2.553 -1.092X1 + 1.961X2. Hal ini berarti bahwa pengaruh total dari variabel X1 adalah -1.092 dan pengaruh total dari variabel X2 adalah 1.961. Pengujian kolinieritas menunjukkan bahwa variabel X1 dan variabel X2 tidak mengandung multikolinieritas karena nilai Tolerance adalah 0.950 dan nilai Variance Inflation Factor (VIF) adalah di bawah 10.
Collinearity Diagnostics a
Model Dimension Eigenvalue Condition Index Variance Proportions (Constant) X1 X2 1 1 2.892 1.000 .01 .01 .01 2 .075 6.212 .05 .91 .24 3 .033 9.347 .94 .08 .75 a. Dependent Variable: Y
12
Residuals Statistics a
Minimum Maximum Mean Std. Deviation N Predicted Value 1.88 12.13 7.40 2.761 10 Residual -1.251 1.118 .000 1.042 10 Std. Predicted Value -1.998 1.714 .000 1.000 10 Std. Residual -1.059 .946 .000 .882 10 a. Dependent Variable: Y
Hasil perhitungan Suliyanto adalah :
R 2 = 0.875 R disesuaikan = 0.840 Standard Error of estimate = 1.1818 F-hitung = 24.567
Y = 2,5529 -1,0921X 1 +1,9608X 2 +
Hasil-hasil di atas adalah benar akan tetapi Suliyanto belum melakukan pengujian normalitas distribusi data, pengujian homogenitas varians, pengujian linieritas, pengujian heterosedastisitas, pengujian multikolinieritas, dan pengujian otokorelasi. Suliyanto menyebut Uji Asumsi Klasik yaitu Uji Normalitas, Non-Heterskedastisitas, Non- Multikolinieritas, Non-Autokorelasi, dan Linearitas akan tetapi tidak melakukan pengujian- pengujian tersebut. Pengujian Durbin-Watson menghasilkan du adalah 1.64, dl adalah 2.36 dan Durbin-Watson yang dihasilkan adalah 3.386. Hal ini berarti bahwa otokorelasi negatif terdapat antara variabel X1 dan X2. Suliyanto sangat menguasai perhitungan-perhitungan dalam pengujian asumsi klasik akan tetapi dalam contoh di atas Suliyanto tidak menerapkan kemampuan tersebut. Hal ini berarti bahwa kesimpulan dan implikasi yang disusun menjadi tidak bermakna dan tidak bermanfaat sebagai akibat dari kesalahan memakai teknik analisis data.
Tulisan Suliyanto banyak mengandung kesalahan dan kelemahan sehingga perlu dilakukan kritik seperti kritik yang telah dilakukan atas tulisannya tentang analisis regresi sederhana. 13
Kesalahan dan kelemahan ini perlu dikritik karena jika pembahasan ini merupakan bahan perkuliahan maka kesalahan dan kelemahan akan berkembang secara eksponensial pada para mahasiswa dan mereka menganggap analisis mereka tentang analisis regresi jamak adalah benar dan serupa dengan bahan yang diterima oleh mereka dalam perkuliahan. Kritik lain akan dilancarkan pula atas tulisah Suliyanto yang berjudul Path Analysis (Analisis Jalur), http ://manajement-unsoed.ac.id