OLEH : SOEMARTINI
JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PADJADJARAN JATINANGOR 2007
BAB I PENDAHULUAN
1.1 Latar Belakang Masalah Analisis regresi merupakan analisis statistik yang digunakan untuk mengetahui adanya keterkaitan antara satu variabel tak bebas dengan satu atau lebih variabel bebas dan mempelajari bagaimana membangun sebuah model fungsional dari data untuk dapat menjelaskan atau meramalkan satu fenomena alami atas fenomena yang lain. Jika dalam analisis melibatkan satu variabel bebas, maka analisis yang digunakan adalah Analisis Regresi Linier Sederhana. Sedangkan jika melibatkan lebih dari satu ( minimal dua ) variabel bebas, analisis yang digunakan adalah Analisis Regresi Linier Multipel. Baik pada Analisis Regresi Linier Sederhana maupun Analisis Regresi Linier Multipel dilakukan penaksiran model melalui metode tertentu. Yakni Taksiran titik yang dapat diperoleh dengan menggunakan metode penaksiran berikut : 1. Metode kuadrat kecil biasa ( Ordinary Least Square) 2. Metode kemungkinan maksimum (Maksimum Likelihood) Agar dapat menggunakan model regresi yang ditaksir untuk masalah penaksiran selang kepercayaan, pengujian hipotesis, maupun peramalan, model tersebut harus didasarkan pada beberapa asumsi yang harus dipenuhi. Beberapa asumsi regresi multiple adalah pelanggaran yang kuat dan yang lain dipenuhi di dalam perancangan suatu studi yang wajar (bebas dari pengamatan-pengamatan). Dalam bahasan ini, kita akan fokus pada asumsi-asumsi regresi multiple yang bukan pelanggaran kuat. Secara rinci, kita akan mendiskusikan tentang kenormalam/kewajaran, asumsi linearitas, dan homoskedastisitas. 1.2 Maksud dan Tujuan Penulisan Maksud dan tujuan penulisan makalah ini adalah membicarakan tentang asumsiasumsi pada regresi yakni homoskedastisitas dan kenormalan . Secara rinci, kita akan membahas tentang kenormalam/kewajaran, asumsi linearitas.
1.3 Identifikasi Masalah Uji statistik biasanya menggunakan asumsi-asumsi tertentu disekitar variabelvariabel yang digunakan di dalam analisa. Ketika asumsi-asumsi ini tidak ditemukan maka hasil-hasil itu tidak akan digunakan, yang berarti menghasilkan suatu kesalahan Type I atau Type II. Beberapa asumsi model regresi adalah pelanggaran yang kuat ( Autokorelasi, Multikolinearitas dan Homoskedastisitas ) yang lain dipenuhi di dalam perancangan suatu studi yang wajar (bebas dari pengamatan-pengamatan). Oleh karena itu, kita akan fokus pada pada salah asumsi regresi yaitu homoskedastisitas. Secara rinci, kita akan mendiskusikan tentang kenormalam/kewajaran, asumsi linearitas, dan homoskedastisitas.
fungsional (Hubungan Kausal /Sebab Akibat) dari data untuk dapat menjelaskan ataupun meramalkan suatu penomena alami atas dasar fenomena yang lain dikenal sebagai Analisi Regresi. Hubungan yang terbentuk dapat melibatkan satu atau lebih variabel dependen dengan satu atau lebih variabel independen. 2.1.Regresi Linier Secara Umum Dari suatu eksperimen diperoleh data sebagai berikut : No. Populasi 1 2 . . . N Y Y11 Y21 X1 X11 X21 X2 X12 X22 . Xk X1k X2k
YN1
XN1
XN2
XNk
Jika model regresi linier dituliskan dalam bentuk skalar sebagai berikut : Yi = 0 + 1Xi1 + 2Xi2 + 3Xi3 + +kXik + i Dimana : i = 1, 2,3, ... , N Keterangan : Y X 0 1..k = Variabel Dependen = Variabel Independen = Koefisien Intercept = Koefisien Regresi = Variabel Gangguan (Error) linier sederhana dan Nk+1
sedangkan jika k > 1 maka model regresinya adalah model regresi linier multipel
Model regresi di atas dapat juga dijabarkan sebagai berikut : Y1 = 0 + 1X11 + 2X12 + 3X13 + +kX1k + 1 Y2 = 0 + 1X21 + 2X22 + 3X23 + +kX2k + 2 . . YN = 0 + 1XN1 + 2XN2 + 3XN3 + +kXNk + N Dapat ditulis dalam bentuk matriks sebagai berikut =
+
Nx1
Y= X
Nx ( k +1) ( k +1) x1
Nx1
: Vektor variabel tak bebas : Matrik variabel bebas : Vektor parameter : Vektor variabel gangguan
2.2 Variabel Variabel Yang Distribusi Normal Asumsi regresi mempunyai variable variable yang berdistribusi normal. Variabelvariabel yang tidak berdistribusi normal ( kemiringan, kurtosis atau variable dengan outlier yang kuat) dapat menyimpangkan suatu hubungan dan uji signifikansi. Ada beberapa kumpulan informasi yang berguna bagi peneliti didalam menguji asumsi ini : 1.) Pemeriksaan visual dengan plot data (Histogam) 2.) Skewnes dan Kurtosis Untuk menguji normalitas data baik secara univariate (per indikator) atau secara multivariate (seluruh indikator ) menggunakan skewness (kemiringan data) dan kurtosis (keruncingan data ) dimana kedua parameter tersebut pada setiap
indikatornya terdapat nilai critical rasio (CR). Pada tingkat signifikan 1% nilai CR berada diantara 2,58 (-2,58 CR +2,58 ) , jika diluar batas ini dapat dikatakan data pada indicator tersebut tidak normal. Nilai skewness yang positif mengindikasikan tingginya frekueni nilai yang ada di sebelah kiri puncak distribusi normal demikian pula sebaliknya sedangkan Nilai kurtosis yang negative menunjukkan distribusi yang landai (varians besar ) sedangkan nilai kurtosis yang positif menunjukan distribusi data yang memuncak (Satu nilai mendominasi). 3.) P-P plot. Dengan memplot variable dependen dengan standardized residual Kumpulan informasi ini dapat memberikan informasi untuk peneliti tentang kenormalan, dan uji Kolmogorov-Smirnov dapat melengkapi statistik inferensial pada kenormalan/kewajaran. Pencilan dapat dikenali melalui pemeriksaan visual Histogram atau distribusi frekuensi atau dengan mengubah data menjadi z-scores. 2.3. Asumsi Suatu Hubungan yang Linier Antara Independent dan Variabel Regresi multipel standard hanya dapat memperkirakan hubungan antara variable dependen dan variable independent jika hubungannya linear. Banyak contoh dalam ilmu sosial dimana yang terjadi adalah hubungan non linear . Hubungan nonlinear ini penting dalam analisis. Jika hubungan antara variable independent dan variable dependen tidak linear, hasil dari analisis regresi akan menilai terlalu rendah pada hubungan yang sebenarnya. Penilaian yang terlalu rendah ini memiliki dua resiko : meningkatkan potensi error type II untuk variable independent, dan dalam kasus regresi multiple peningkatan resiko error type I (penilaian nilai terlalu tinggi) untuk variable independent lainnya yang memilki varians yang sama dengan variable independent tersebut. Untuk mendeteksi nonlinearitas dapat digunakan beberapa metoda. Metoda pertama menggunakan teori atau penelitian sebelumnnya untuk menginformasikan analisis ini. Tetapi metoda ini tidak aman. Metode deteksi yang banyak digunakan adalah pengujian plot sisa (plot-plot sisa standar sebagai fungsi dari nilai-nilai yang diprediksi terdapat Dependen
pada software statistika). Gambar 1 memperlihatkan plot titik dari sisa yang memperlihatkan kurva linier dan hubungan linier Gambar 1: Contoh dari kurva linier dan hubunan linier dengan sisa-sisa yang distandarisasi oleh standarisasi prediksi
Hubungan Curvilinear Hubungan Linear
E ( u i2 ) = 2
Pelanggaran asumsi Homoskedastisitas disebut dengan Heteroskedastisitas yakni kondisi dimana gangguan ui tersebut adalah berbeda-beda untuk setiap i.
E ( u i2 ) = i2
2 1
0
2 2
0 0
2 n
E(uu t ) =
0 0
dengan
i = 1,2,..n
E ( u i2 ) = i2
Asumsi ini dapat diditeksi oleh pengujian visual dari sisa-sisa yang distandardisasi residual (error) oleh prediksi nilai standarisasi regresi. Hal ini termasuk sebagai satu opsi statistik yang paling modern. Seperti contoh di bawah ini Figure 2. Examples of homoscedasticity and heteroscedasticity
Idealnya, residu secara acak tersebar di sekitar 0 (garis mendatar). Heteroskedastisitas diindikasikan ketika residu itu tidak datar tersebar di sekitar baris. Ada banyak bentuk heteroskedastisitas seperti suatu bentuk dasi kupu-kupu atau pola tertento lainnya. Ketika plot dari residual muncul menyimpang dari normal, lebih formal untuk heteroskedastisitas harus dilakukan uji. Uji yang dilakukan untuk masalah ini adalah : 1.) Uji Goldfeld-Quandt Asumsi: i) n 2k; k = banyaknya variabel bebas
2 e )
F=
i =1 n1 j=1
e i2besar e2 jkecil
ket : ei2 besar didapat dari persamaan regresi untuk kelompok data besar
ei2 kecil didapat dari persamaan regresi untuk kelompok data kecil Kriteria uji : Tolak H0 jika Fhitung > F Catatan : untuk n > 30 : c optimum = n/4 untuk k > 1 maka pilih salah satu variabel X yang diurutkan 2.) Uji Glejser Asumsi : i)
i [1/2(n-c) (k+1) , 1/2(n-c) (k+1)],
Xi + vi + vi + v
Xi
+
Xi
+ vi
ei = 0 + 1 X i + vi
vii) ei
= 0 + 1 X i2 + vi
Dengan salah satu bentuk model regresi di atas uji koefisien regresi (uji t) untuk model yang dipilih. Dampak heteroskedastisitas, 2. Hasil taksiran yang didapat dari model regresi yang mengandung heteroskedasitas akan tetap tak bias tetapi variansnya besar (tidak efisien). 3. Selang kepercayaan semakin lebar.
Triwulan 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Sumber : Pieter Leunupun profitabiltas ekuitas dan beberapa faktor yang mempengaruhinya ( Studi Pada Beberapa KUD di Kota AMBON ), http://puslit.petra.ac.id/journals/accounting/
Model Regresi Linier Multipel Data di atas dapat dibentuk dalam model : Yi = 0 + 1Xi1 + 2Xi2 + 3Xi3 + +kXik + i Dengan koefesien regresinya dapat ditaksir melalui : = ( X t X )1 ( X tY )
20 = 4.692 2.706
4.692
2.706
70.907
X tY =
Maka didapat :
= 20 4.692 2.706 0.177 = 0.5227 0.5829 0.0261 Maka persamaan regresi linear multipelnya diperoleh: 4.692 1.150254 0.6236 2.706 0.6236 70.907 17.06455
1
0.451174 9.782204
Profitabilitas Equitas
Frequency
1 Mean = 0.1167 Std. Dev. = 0.074892 N = 20 0.000 0.050 0.100 0.150 0.200 0.250 0.300
Profitabilitas Equitas
Dari Histogram terlihat Untuk variable Profitabilitas equitas dengan nilai skewness (+0,361) dan nilai kurtosis (-1,226) memilki distribusi yang cenderung disebelah kanan distribusi normal dan cenderung melandai
Profit Margin
Frequency
1 Mean = 0.2346 Std. Dev. = 0.051047 N = 20 0.150 0.200 0.250 0.300 0.350
Profit Margin
Dari Histogram terlihat Untuk variable Profit margin dengan nilai skewness (+0,315) dan nilai kurtosis (-1,302) memilki distribusi yang cenderung disebelah kanan distribusi normal dan cenderung melandai
Intvestment Turnover
Frequency
1 Mean = 0.1353 Std. Dev. = 0.066906 N = 20 0.050 0.100 0.150 0.200 0.250 0.300 0.350
Intvestment Turnover
Dari Histogram terlihat Untuk variable Invesment turnover dengan nilai skewness (+1,267) dan nilai kurtosis (+1,977) memilki distribusi yang cenderung disebelah kiri distribusi normal dan cenderung memuncak
Equity Multiplier
Frequency
Equity Multiplier
Dari Histogram terlihat Untuk variable Equity Multplier dengan nilai skewness (+0,219) dan nilai kurtosis (-1,566) memilki distribusi yang cenderung disebelah kanan distribusi normal dan cenderung melandai
Valid Missing
Skewness
Ukuran Skewness untuk profitabilitas ekuitas adalah 0, 361, profit margin (0,315) , investment turnover (1,267) , dan equity multiplier (0,219). Untuk mengetahui apakah data normal atau tidak nilai tersebut diubah ke angka rasio . Rasio skewness : Nilai Skewness / std.error skewness Maka: Profitabilitas ekuitas : 0,361 = 0, 705 0,512 0, 315 = 0, 615 0,512 1, 267 = 2 ,47 0,512 0, 219 = 0, 427 0,512
Profit margin
Investment turnover
Equity multiplier
Data dikatakan berdistribusi normal jika nilai skewness berada diantara 2,58 sampai dengan +2,58
Kesimpulan
Berdasarkan perhitungan rasio skewness diatas terlihat bahwa nilai rasio skewness dari Profitabilitas ekuitas, profit margin, investment turnover, dan equity multiplier terletak pada daerah tersebut , maka bisa dikatakan data berdistribusi normal. Nilai skewness yang positif mengindikasikan tingginya frekueni nilai yang ada di sebelah kiri puncak distribusi normal
Kurtosis
Ukuran kurtosis untuk profitabilitas ekuitas adalah -1,226, profit margin (-1,302) , investment turnover (1,977) , dan equity multiplier (-1,566). Untuk mengetahui apakah data normal atau tidak nilai tersebut diubah ke angka rasio . Rasio skewness : Nilai Skewness / std.error skewness Maka: Profitabilitas ekuitas : 1, 226 = 1, 236 0, 992 1, 302 = 1,313 0,992 1,977 = 1, 993 0, 992 1,566 = 1,579 0,992
Profit margin
Investment turnover
Equity multiplier
Data dikatakan berdistribusi normal jika nilai rasio kurtosis berada diantara -2,58 sampai dengan +2,58
Kesimpulan
Berdasarkan perhitungan rasio kurtosis diatas terlihat bahwa nilai rasio kurtosis dari Profitabilitas ekuitas, profit margin, investment turnover, dan equity multiplier terletak pada daerah tersebut , maka bisa dikatakan data berdistribusi normal. Nilai kurtosis yang negative menunjukan distribusi yang landai (varians besar ) sedangkan nilai kurtosis yang positif menunjukan distribusi data yang memuncak (Satu nilai mendominasi ).
c)
E x p e c te d C u m P ro b
0.8
0.6
0.4
0.2
Dari Normal P-P plot diatas dapat dijelaskan bahwa data mendekati garis normal artinya data secara deskritif dapat dikatakan berasumsi distribusi normal.Hal ini juga dapat dibuktikan dengan uji kolmogorov-smirnov
Kolmogorov-smirnov Test
One-Sample Kolmogorov-Smirnov Test N Normal Parameters a,b Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data. y Mean Std. Deviation Absolute Positive Negative 20 .11670 .074892 .189 .189 -.146 .846 .471 x1 20 .23460 .051047 .163 .163 -.133 .727 .666 x2 20 .13530 .066906 .158 .158 -.133 .708 .697 x3 20 3.54535 1.483207 .185 .185 -.159 .828 .499
Pengujian Hipotesis
Ho : data berdistribusi normal H1 : data tidak berdistribusi normal Kriteria Uji tolak Ho jika P-value < 0,05 ternyata P-value > 0,05 maka Ho diterima artinya asumsi normalitas di atas terpenuhi.
2 Uji Linieritas
Untuk menguji linieritas kita harus membuat diagram pencar (scatter plot) antara standardized residual dengan standardized predicted
Scatterplot
-1
-2
-2
-1
Berdasarkan Scatterplot diatas dapat dijelaskan bahwa asumsi linear tidak terpenuhi. Hal ini bisa dilihat dari grafik scatter plot diatas yang membentuk suatu pola tertentu (Parabola)
2.500000E-3
2.000000E-3
1.500000E-3
e i2
1.000000E-3 5.000000E-4 0.000000E0 0.000 0.050 0.100 0.150 0.200 0.250
y_topi
Berdasarkan Scatter diatas mengindikasikan data terbebas dari heteroskedastisitas karena tidak membentuk suatu pola tertentu
Taraf Uji :
Karena n < 30 maka c = (n-1), dimana c adalah pengamatan yang ditengah-tengah. Dengan n = 20 maka c = 19/2 = 9,5 masing berjumlah 9 pengamatan.
Statistik Uji
n2
F=
i =1 n1 j =1
Untuk Xi
X1
0.241 0.244 0.261 0.284 0.289 0.306 0.308 0.309 0.311
ei besar
0.017 -0.013 0.024 0.046 -0.024 0.027 -0.016 -0.028 -0.029
ei
X1
0.153 0.18 0.183 0.187 0.189 0.191 0.206 0.206 0.21
ei kecil
-0.03 -0.024 0.019 0.016 0.002 -0.027 0.019 0.019 0.007
ei
0.000289 0.000169 0.000576 0.002116 0.000576 0.000729 0.000256 0.000784 0.000841 0.006336
0.0009 0.000576 0.000361 0.000256 0.000004 0.000729 0.000361 0.000361 0.000049 0.003597
F=
Untuk X1 X1
0.147 0.154 0.161 0.169 0.169 0.17 0.188 0.251 0.322
ei besar
0.017 0.024 0.046 0.019 0.019 0.005 0.027 -0.03 -0.024
ei
X1
0.061 0.063 0.064 0.07 0.072 0.097 0.103 0.103 0.104
ei kecil
0.019 0.016 -0.027 0.007 -0.016 -0.024 -0.028 -0.016 -0.029
ei
0.000289 0.000576 0.002116 0.000361 0.000361 0.000025 0.000729 0.0009 0.000576 0.005933
0.000361 0.000256 0.000729 0.000049 0.000256 0.000576 0.000784 0.000256 0.000841 0.004108
F=
Untuk X3 X3
1.56 1.7 1.79 1.87 2.289 2.34 2.537 2.72 2.83
ei kecil
-0.03 0.007 0.019 0.016 -0.013 0.002 -0.024 -0.029 -0.028
ei
X3
3.78 3.789 4.84 4.99 5.142 5.52 5.53 5.53 5.69
ei besar
0.005 0.027 -0.027 -0.016 0.024 0.017 0.019 0.019 0.046
ei
0.0009 0.000049 0.000361 0.000256 0.000169 0.000004 0.000576 0.000841 0.000784 0.00394
0.000025 0.000729 0.000729 0.000256 0.000576 0.000289 0.000361 0.000361 0.002116 0.005442
F=
Kriteria Uji :
Tolak H0 jika Fhitung > Ftabel, terima dalam hal lainnya. Ternyata Untuk variable X1 Fhitung = 1,761< 5,05= F0.05(5,5) , artinya H0 diterima. Untuk variable X2 Fhitung = 1,444< 5,05= F0.05(5,5) , artinya H0 diterima. Untuk variable X3 Fhitung = 1,381< 5,05= F0.05(5,5) , artinya H0 diterima.
Kesimpulan :
Dengan tingkat signifikansi sebesar 95% maka dapat disimpulkan bahwa terdapat heteroskedastisitas dalam data. tidak
[ei ]
0,016 0,029 0,016 0,005 0,027 0,028 0,019 0,027 0,007 0,024 0,019 0,002 0,024 0,019 0,017 0,03 0,013 0,016 0,024 0,046
X1 0,187 0,311 0,214 0,22 0,306 0,309 0,206 0,191 0,21 0,261 0,183 0,189 0,18 0,206 0,241 0,153 0,244 0,308 0,289 0,284
[ei ]
0,016 0,029 0,016 0,005 0,027 0,028 0,019 0,027 0,007 0,024 0,019 0,002 0,024 0,019 0,017 0,03 0,013 0,016 0,024 0,046
X2 0,063 0,104 0,072 0,17 0,188 0,103 0,169 0,064 0,07 0,154 0,061 0,108 0,322 0,169 0,147 0,251 0,13 0,103 0,097 0,161
[ei ]
0,016 0,029 0,016 0,005 0,027 0,028 0,019 0,027 0,007 0,024 0,019 0,002 0,024 0,019 0,017 0,03 0,013 0,016 0,024 0,046
X3 1,87 2,72 3,63 3,78 3,789 2,83 5,53 4,84 1,7 5,142 1,79 2,34 2,537 5,53 5,52 1,56 2,289 4,99 2,83 5,69
ei = 1 X 1 + Vi
Dengan meregresikan nilai absolut dari residu leil terhada variabel X diperoleh persamaan sebagai berikut :
Untuk pengujian X1
Coefficientsa Unstandardized Coefficients B Std. Error ,004 ,010 ,069 ,043 Standardized Coefficients Beta ,353
Model 1
t ,409 1,599
a. Dependent Variable: EI
Hipotesis Uji :
H0 : Tidak terdapat heteroskedastisitas H1 : Terdapat heteroskedastisitas
: 5% t tabel = t
/2 ; (n - 1)
Kriteria Uji : Terima H0 jika - t tabel < t hitung < t tabel Terima H0 jika p-value > 0,05
Kesimpulan : Karena t hitung (1,599) < t tabel (2,09) dan p-value (0,127) > 0,05 maka H0 diterima. Artinya bahwa data tersebut tidak terdapat heteroskedastisitas.
Untuk Pengujian X2
Coefficientsa Unstandardized Coefficients B Std. Error ,015 ,005 ,039 ,034 Standardized Coefficients Beta ,262
Model 1
t 2,967 1,152
a. Dependent Variable: EI
/2 ; (n - 1)
Kriteria Uji : Terima H0 jika - t tabel < t hitung < t tabel Terima H0 jika p-value > 0,05 Kesimpulan : Karena t hitung (1,152) < t tabel (2,09) dan p-value (0,264) > 0,05 maka H0 diterima. Artinya bahwa data tersebut tidak terdapat heteroskedastisitas.
Untuk Pengujian X3
Coefficientsa Unstandardized Coefficients B Std. Error ,014 ,006 ,002 ,002 Standardized Coefficients Beta ,272
Model 1
t 2,383 1,198
a. Dependent Variable: EI
/2 ; (n - 1)
Kriteria Uji : Terima H0 jika - t tabel < t hitung < t tabel Terima H0 jika p-value > 0,05 Kesimpulan : Karena t hitung (1,198) < t tabel (2,09) dan p-value (0,246) > 0,05 maka H0 diterima. Artinya bahwa data tersebut tidak terdapat heteroskedastisitas.
DAFTAR PUSTAKA Dien Sukardinah. Soemartini, I.Gde Mindra.2005. Bahan Kuliah Regresi Lanjutan . Jurusan Statistika . Unpad, Jatinangor. Osborne, Jason & Elaine Waters.2002.Four Assumptions of Multiple Regression That Researchers Should Always Test. Practical Assessment , Research & Evalution , 8(2) Retrieved August 18,2006 from http:// edresearch.org/pare/getvn.asp?v=8&n=2