Anda di halaman 1dari 25

1 EKONOMETRIKA 1.

1 Definisi Ekonometrika : pengukuran ekonomi (harfiah) contoh suatu analisis mencoba mengukur pengaruh harga terhadap permintaan. Atau tekhnik analisis yg merupakan gabungan beberapa disiplin ilmu (teori ekonomi, statistik ekonomi, matematika ekonomi, statistikmatematis). Ekonometrika merupakan disiplin ilmu tersendiri, matematika ekonomi berhubungan dengan pembentukan model teori atau persamaan matematis tanpa melakukan verifikasi kebenaran suatu teori, statistika ekonomi berhubungan dengan pengumpulan pengolahan dan penyajian data apakah tabulasi, diagram dsb (widarjono : 4). 1.2 Metodologi ekonometrika Metodologi ekonometrika memiliki relavansi dengan pendekatan kuantitatif, karena metode ekonometrika mencoba melihat argumentasi teori yang dijabarkan oleh parameter variabel yang terukur. Sebuah teori di interprestasikan kedalam pemodelan matematis kemudian diestimasi untuk mendapatkan parameter sampel yang mendekati parameter pupulasinya. Kemudian dilakukan pengujian hipotesis terhadap hubungan variabel-variabel bentukan, selanjutnya hasil ini menjadi bahan analisis teori ekonomi yang dikaji untuk mengambil keputusan/kebijakan atau prediksi. Pernyataan teori/hipotesis

Spesifikasi model tidak Estimasi parameter dan uji hipotesis ya Kesimpulan/Prediksi

Sebagai contoh misalkan teori permintaan barang yang menyatakan bahwa harga berpengaruh negatif terhadap permintaan suatu kuantitas permintaan suatu komoditas. Langkah selanjutnya menuangkan teori ke dalam pemodelan matematis y=a+bx dimana b/ < o (hipotesis negatif). Y variabel terikat dan x variabel bebas. Model matemati diatas adalah model exact atau deterministik padahal model statistik atau ekonometrika mendasarai analisisnya pada pemodelan yang tidak pasti sehingga model matematis diatas dibentuk menjadi model yang sesuai dengan perilaku ekonomi Yi/t = a + bxi/t + ei/t atau yi/t = 0 + 1xi/t + ei/t tahap selanjutnya adalah pengumpulan data yang kemudian di olah dengan konsep statistik sesuai dengan metodologi analisa data yang dipilih. Tahapan ini berisi estimasi parameter 0 / 1 kemudian uji kelayakan model, uji hipotesis dan pengambilan keputusan.

2 DASAR-DASAR STATISTIKA DALAM EKONOMETRIKA Dalam metodologi ekonometrika ada dua analisa yang digunakan yakni analisa statistik dan analisa ekonomi. Analisa statistik terkait dengan verifikasi model estimasi parameter dan uji hipotesis (stastical inference) sedangkan analisis ekonomi melibatkan pemahaman teori ekonomi secara utuh yang dikaitkan dengan hasil anlisa statistik kemudian dituangkan sebagai dasar pengambilan kebijakan dan kesimpulan atas sebuah kajian ekonomi. Oleh sebab itu pemahaman ekonometrika tentu sangat tergantung dari pemahaman ilmu ekonomi, matematika dan statistika ekonomi. Berikut diuraikan secara ringkas konsep-konsep statistik yang mendasari pengembangan ekonometrika : 2.1 Exsperiment, sample space and event 2.1.1 Eksperimen Percobaan atau eksperimen sebagai langkah sebuah penelitian seringkali dipergunakan secara luas. Seperti halnya dalam pelemparan dadu atau koin, paling tidak ada dua hal atau sifat dasar dari setiap eksperimen : a. Possible outcomes, setiap percobaan memiliki kemungkinan hasil dari peristiw-peristiwa yang di harapkan. Misalkan pelemparan mata uang kemungkinan hasilnya bisa keluar gambar atau nominal koin. Ekspektasi mengenai relasi antar variabel bisa sesuai hipotesis atau sebaliknya. b. Pada tiap-tiap eksperimen akan sangat sulit menentukan kemungkinan hasil yang akan terjadi, hasil yang muncul merupakan estimasi dari perilaku yang dihipotesiskan dari setiap penarikan data. 2.1.2 Sample space (ruang sampel) Merupakan sebuah set yang berisi seluruh kemungkinan yang akan terjadi (total possible outcomes) dan setiap elemen dari ruang sampel disebut dengan sample point. Misalkan dari 3 orang anak dalam sebuah keluarga 2 diantaranya laki-laki (L), dari eksperimen ini terdapat 3 ruang sampel yaitu (LLP,LPL,PLL) dengan 2 sampel point yakni L & P. 2.1.3 Peristiwa (event/sample point) Bagian dari hasil eksperimen yang diinginkan atau merupakan sub set dari ruang sampel yang ada. Misalkan dari ruang sampel (LLP,LPL,PLL) diharapkan muncul kombinasi LLP maka LLP disebut sebagai event begitu juga LPL dan PLL yang merupakan sub set dari ruang sampel yang ada. Bukan tidak mungkin sebuah penelitian dihadapkan pada pemilihan suatu subset tertentu dari sekumpulan ruang sampel data yang ada. 2.2 Probabilitas dan variabel random 2.2.1 Probabilitas Setiap peluang munculnya sebuah peristiwa dari sekumpulan ruang sampel disebut probabilitas dari sample point tertentu dengan nilai maksimum sebesar kemunculan relatif

(frekuensi relatif) dari sebuah eksperimen. Probabilitas kejadian A dalam ruang sampel tertentu atau P(A) sama dengan berapa kali nilai A terjadi dari beberapa kali percobaan. Misal jika semua hasil yang mungkin adalah n dan semua kemungkinan hasil kejadian A adalah m maka probabilitas A P(A)=m/n. 2.2.2 Variabel random Sebuah percobaan yang mendasari hipotesisnya pada sekumpulan data (statisticalsample/infrence) adalah penarikan secara acak suatu peristiwa yang diharapkan dengan nilai bersifat diskrit/tertentu dan kontinu/interval. Contoh penjumlahan setiap sample point dari dua dadu yang dilempar adalah 2,4,6,8,10,12 merupakan nilai diskrit dari ruang sampel 1,2,3,4,5,6 pertama dan 1,2,3,4,5,6 kedua. Sedangkan variabel kontinu mengambil nilai di dalam satu interval tertentu, misal berat badan 60-70Kg. Statistik sampel merupakan distribusi probabilitas dari sekumpulan data yang digunakan sebagai sampel. Sifat-sifat penting dari distribusi probabilitas : a. Nilai harapan (expected value), nilai harapan dari sekumpulan probabilitas diskrit sample point yang ada.. yang didefinisikan sebagai : E(X) = x.f(x) dimana f(x) adalah pdf (probability density function) Contoh : dalam pelemparan sebuah dadu nilai harapan X yang muncul adalah EX=1(1/6)+2(1/6)+3(1/6)+4(1/6)+5(1/6)+6(1/6) b. Varian adalah distribusi dari nilai x disekitar rata-ratanya Var (X) = 2 = E(X-)2 c. Kovarian, apabila varian mengukur nilai dari sekumpulan distribusi rata-rata untuk satu variabel X. Maka kovarian mengukur nilai harapan dari sekumpulan distribusi rata-rata X atau Y. Cov(X,Y)=E[(X-x)(Y- y)] =E(XY)- x y d. koefisien korelasi Koefisien determinasi bernilai 0r1 jika r=0 maka tidak ada variasi variabel terikat (y) yang mampu dijelaskan oleh variasi variabel bebas (regresor) x. Sebaliknya bernilai 1 jika semua variasi y dijelaskan oleh x.

Sedangkan angka korelasi r merupakan akar dari r

2.3 Distribusi probabilitas dalam statistik ada beberapa distribusi probabilitas yang penting dan sering kali mendasar analisis ekonomi yakni distribusi normal, distribusi chi square, distribusi t. 2.3.1 Distribusi normal Suatu teori distribusi statistik yang terkenal adalah distribusi normal yang berbentuk lonceng (bell shaped). Distribusi normal diartikan senagai kondisi dimana data tersebar atau terkumpul pada daerah rata-rata dan hanya sedikit pada daerah outlier. Distribusi normal merupakan probabilitas normal yang kontinyu dan simetrik dari ukuran karakteristik data (parameter) rata-rata dan standar deviasi. Pengujian terhadap ditribusi normal dari sekumpulan data dilakukan terhadap presentase data observasi berada dalam plus-minus satu standar deviasi atau plus minus dua standar deviasi. Suatu distribusi dikatakan normal jika 65% data berada dalam satu standar deviasi, dan 95% data dalam dua standar deviasi. Persamaan matematis distribusi probabilitas normal : [ ]

Dengan : : rata-rata sampel : rata-rata populasi : simpangan baku (deviasi standar) populasi : 3,1416 e(exp) : 2,7183

Luas fungsi probabilitas sebelah kiri dan kanan 0,5 (simetrik), sedangkan luas total kurve normal adalah 1 , jika diambil secara random suatu sampel dengan nilai parameter diantara a dan b maka nilai x a dan b merupakan luas daerah pada absis (x) sebagaimana digambarkan dalam kurve berikut :

-3

-2

Gbr. Distribusi normal

Sumbu absis pada kurve normal merupakan nilai standar Z, nilai x dikonversikan ke dalam normal Z dengan formula : Nilai harapan dan varian : E(x) = dan Var (X) = 2 2.3.2 Distribusi chi-square (x2) Distribusi chi square digunakan untuk uji hipotesis yang berhubungan dengan varian atau variabel random. Apabila sebuah distribusi varian daria variabel yang bersifat random (rata-rata 0 dan varian 1) yakni Z1,Z2,Z3 . Zk dan masing-masing tidak saling tergantung (independent)maka jumlah kuadrat (square) dari distribusi normal (konversi Z) adalah : Akan memiliki distribusi chi-square (X2) dengan derajat kebebasan df=k, k adalah jumlah variabel bebas.
P(X )
2

K=2

K=5

K=10

Gambar. Distribusi chi-square 2.3.3 distribusi t Dalam praktik statistik varian dari sebuah variabel random sulit ditentukan namun secara teori varian ini menjadi asumsi dasar, dan diperhitungkan pada uji hipotesis. Oleh sebab itu telah dikembangkan distribusi t untuk menjawab kondisi tersebut. Sebuah variabel random dengan distribusi normal Z1 ~ N (=0 dan =1) dan Z2 mengikuti chi-square dengan df=k dan tidak tergantung (Z1 dan Z2 tidak tergantung/independent) maka varibel random tersebut memiliki distribusi t sebagai berikut :

K = 120 (normal) K = 20 K=5

Gambar. Distribusi t dengan berbagai df Perhatikan gambar, semakin besar sampel atau df(n-1) kurva semakin mendekati normal

3 REGRESI DAN KORELASI LINEAR SEDERHANA Apabila suatu model berusaha menggambarkan hubungan antar variabel dan selanjutnya sebagai alat prediksi atau dugaan terhadap nilai suatu variabel terikat oleh sekurang-kurangnya satu variabel prediktor, maka analisa yang bisa kita gunakan ialah analisa regresi dan korelasi. Analisa regresi dan korelasi digunakan untuk melihat hubungan (arah dan kekuatan) antar variabel. Regresi model digunakan untuk tujuan estimasi (prediksi) suatu variabel, sedangkan korelasi digunakan untuk melihat kekuatan hubungan diantara variabel-variabel kuantitatif. Analisis regresi linear sederhana menghasilkan persamaan berdasarkan pada data yang diobservasi dari variabel terikat (dependen) dan satu variabel bebas (independen). Regresi dengan satu variabel bebas disebut regresi linear sederhana. Sedangkan untuk menentukan apakah terdapat hubungan (kekuatan atau arah) antar variabel bebas dan satu variabel terikat disebut korelasi liner sederhana. Jika x adalah sebuah variabel bebas (regresor) dan y adalah varibel terikat, maka hubungan x dan y dalam persamaan regresi menjadi y = a + bx dimana a merupakan nilai intersep dan b disebut koefisien arah garis lurus (regresi liner). Persamaan tersebut merupakan persamaan estimasi atau prediksi nilai y, dimana nilai kecenderungan y tergantung dari besar kecilnya variabel x dengan perubahan konstan b ditambah a. misalkan sebuah persamaan konsumsi c = c0 + MPC (Yd), perubahan nilai C meningkat sesuai peningkatan Yd sebesar MPC + c0. Artinya apbila Yd meningkat 1 satuan maka C diprediksi meningkat sebesar c0 + MPC. 3.1 Persamaan regresi linear sederhana Contoh model regresi sederhana yang menggambarkan hubungan antara tingkat konsumsi dan pendapatan diatas, menjelaskan ketika terjadi kenaikan pendapatan cateris paribus maka konsumsi juga mengalami kenaikan linear sebesar C/Y (MPC), pada tingkat pendapatan nol terdapat konsumsi otonom C0. Dalam fungsi matematisnya C = C0 + MPC(Yd), C adalah konsumsi Yd merupakan pendapatan yang siap dikonsumsi. C0 dan MPC adalah parameter estimasi a dan b. Sehingga dalam persamaan/fungsi konsumsi dalam regresi ditulis sebagai Yi = a + bXi + ui. Berikut grafik yang menggambarkan hubungan antara konsumsi dan pendapatan : Y ui Y = a + bXi

b a X

Dalam setiap observasi data tersebar diantara garis regresi Y = a + bXi, seyogyanya data berada atau minimal mendekati garis regresi. Penyimpangan data terhadap garis estimasi disebut eror (ui).

Melihat kenyataan tersebut maka upaya terbaik yang harus dilakukan adalah dengan mencari nilai a dan b sedemikian hingga deviasi/penyimpangan/error dengan titik pengamatan/observasi sekecil mungkin. Metode yang kita gunakan untuk mencapai nilai error sekecil mungkin disebut OLS (ordinary least square). Metode OLS berusama meminimalkan error atau nilai sum square eror seminimal mungkin (MIN e). Kondisi ini bisa tercapai jika nilai a dan b atau parameter regresi a dan b sudah diketahui, berikut formula untuk mencari nilai parameter a dan b :

3.2 Kesalahan standar sampel estimasi Setiap penarikan sampel dari suatu populasi memiliki nilai standar kesalahan (standar eror), pada model regresi kesalahan standar populasi merupakan simpangan baku yang mengukur variasi titik-titik sampel (observasi) ditas atau dibawah garis regresi.

3.3 Pengujian koefisien garis regresi (signifikansi variabel bebas) Apabila sejumlah sampel dengan koefisien arah regresi b yang merupakan estimasi dari koefisien populasi , maka koefien arah regresi b memiliki kesalahan standar koefisien regresi atau kesalahan standar arah sebesar Sb yang didapatkan dari formula :

Model regresi memiliki asumsi distribusi normal sehingga didapatkan nilai statistik :

Jika koefisien populasi tidak diketahui maka :

Pada df=n-1 pada statistik t (atau Z jika data 30 atau jumlah n >0.5N), dengan pasangan-pasangan hipotesis :

a. Ho : =k dan Ha : k dimana k:koefisien (nilai parameter)populasi Ho ditolak jika |t stat| > t (/2 : df) b. Ho : k dan Ha : >k Ho ditolak jika t stat > t ( : df) c. Ho : k dan Ha : <k Ho ditolak jika t stat < t ( : df) Jika koefisien populasi tidak diketahui (undefined) a. Ho : =0 dan Ha : 0 dimana k:koefisien (nilai parameter)populasi Ho ditolak jika |t stat| > t (/2 : df) b. Ho : 0 dan Ha : >0 Ho ditolak jika t stat > t ( : df) c. Ho : 0 dan Ha : <0 Ho ditolak jika t stat < t ( : df)

3.4 Analisis korelasi Analisis regresi digunakan untuk mendapatkan persamaan estimasi untuk mengetahuai apakan suatu variabel bentukan berkorelasi atau tidak maka kita membutuhkan ukuran korelasi. Ukuran korelasi yang lazim diukur adalah koefisien korelasi ( r ) dan koefisien determinasi (R). Koefisien determinasi bernilai 0r1 jika r=0 maka tidak ada variasi variabel terikat (y) yang mampu dijelaskan oleh variasi variabel bebas (regresor) x. Sebaliknya bernilai 1 jika semua variasi y dijelaskan oleh x.

Sedangkan angka korelasi r merupakan akar dari r

Nilai r positif jika nilai b (parameter regresi sampel) bernilai positif karena pembilang pada penghitungan r sama dengan pembilang untuk mendapatkan nilai b. Untuk menguji apakah suatu koefisien korelasi sampel mampu atau signifikan secara statistik menjelaskan koefisien korelasi populasi () dimana tidak diketahui atau =0. Maka dibutuhkan ukuran statistik pada asumsi normal (t atau z student)yang akan dibandingkan dengan nilai kritis (tabel) : Dengan df pada t student (df=n-2) dan kemungkinan hipotesis : a. Ho : =0 dan Ha : 0 dimana :koefisien korelasi populasi Ho ditolak jika |t stat| > t (/2 : df) b. Ho : 0 dan Ha : >0 Ho ditolak jika t stat > t ( : df) c. Ho : 0 dan Ha : <0 Ho ditolak jika t stat < t ( : df) 3.5 Sifat-sifat taksiran yang utama pada model regresi linear 1. Tak bias E(b) = E(u) = E *1/n Xi+ = 1/n E(Xi) = 1/n (n)= ; :rata-rata populasi 2. Efisien ika var var 3. Terbaik dan tak bias 4. BLUE (best linear unbiased estimator) ila b mempunyai hubungan linear terhadap sampel, jika var b var untuk setiap (linear dalam parameter) 3.6 Asumsi-asumsi yang mendasari model regresi linear dengan tekhnik OLS 1. hubungan linear antara variabel terikat dan bebas (linear dalam parameter) 2. nilai X nilainya tetap untuk observasi yang berulang-ulang (non-stocastic) 3. nilai harapan (expected value) atau rata-rata dari variabel gangguan/error/residual ei adalah nol

3.6 Pengenalan software analisis statistik Ada beberapa software statistik yang membantu kita dalam analisa statistik dan ekonometrika, seperti SPSS, eviews, statistica, matlab dll. Berikut akan diberikan contoh pengolahan data dan analisa sederhana dengan menggunakan software eviews. RUNNING EVIEWS Tampilan awal

Membuat work file Misalkan ada sekumpulan data regresi tentang hubungan tax,inflasi terhadap pertumbuhan ekonomi indonesia (1991s/d2008)
Year 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 gdp (%) 31,5 35,4 32,3 33,5 35,3 32,5 32,2 30,6 30,1 31,5 26,5 19,5 31,8 31,5 26,8 24,9 24,2 26,3 inflation (%) 7,9 8,5 6,2 8,5 9,5 7,9 8,5 6,2 11,0 9,3 12,5 10,0 5,1 6,1 10,5 9,5 7,5 8,1 tax (.jt) 66418 80412 87630 112276 156408 204432 204942 300600 299886 342472 349300 300600 299886 204942 300600 299886 342472 349300

Ls gdp c inflasi tax Ls comand untuk OLS Gdp v terikat inflasi dan tax v bebas C command memunculkan koefisien a dan b Output :
Dependent Variable: GDP Method: Least Squares Date: 10/29/11 Time: 12:10 Sample: 1991 2008 Included observations: 18 Variable C INFLASI TAX R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 390.5508 -0.361875 -0.000259 0.466768 0.395671 32.74372 16082.26 -86.69680 1.786142 Std. Error 37.54107 0.437848 8.23E-05 t-Statistic 10.40330 -0.826485 -3.143810 Prob. 0.0000 0.4215 0.0067 298.0000 42.12028 9.966311 10.11471 6.565184 0.008951

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Substituted Coefficients: ===================== GDP = 390.5508296 - 0.3618750788*INFLASI - 0.0002586820782*TAX

Standar pelaporan dan evaluasi hasil regresi Dalam setiap hasil output eviews tidak semua yang ditampilkan digunakan dalam analisa statistik, berikut digambarkan contoh analisis dari hasil diatas. Persamaan regresi
GDP = 390.5508296 - 0.3618750788*INFLASI - 0.0002586820782*TAX

Uji normalitas Sebuah model bisa diinterpretasikan atau di uji hipotesis (individual t test atau simultanous F test) apabila residual berdistribusi normal. Berikut du contoh tehnik untuk mendeteksi normalitas residual. Dengan histogram residual Klik resid pada menu work file lalu view kemudian pilih histogram and stat

Metode ini lebih kepada deskriptif PDF (probability distributin function) dari sebuah variabel random. Sebuah variabel berdistribusi normal apabila histogram residual menyerupai lonceng (bell shaped).

Dengan uji jarque bera Secara formal normalitas residual bisa di uji dengan JB test, dengan formula sebagai berikut : [ ]

S=koefisien skewnes k=koefisien kurtosis skewness yaitu kecondongan yang merupakan selisih antara rata-rata dan nilai tengah (median),ini menunjukkan simetri tidaknya disribusi sampel. Jika nilai tengah lebih besar dari rata-rata data akan condong ke kiri dan sebaliknya. *kurtosis mengukur apakah data lebih tinggi lebih rendah atau sama dengan distribusi normal (mudrajad kuncoro, 2007). Suatu variabel berdistribusi normal jika nilai s=0 dan k=3 sehingga JB=0.. suatu distribusi residual berdistribusi normal apabila hipotesis JB berada pada daerah penerimaan Ho (tidak signifikan dimana JB<nilai tabel X2) atau fobabilitas JB>derajat signifikansi yang digunakan. Untuk analisis selanjutnya akan dibahas pada bab regresi berganda.

4 REGRESI DAN KORELASI LINEAR BERGANDA Regresi linear sederhana memiliki satu variabel bebas/regresor, sedangkan jika sebuah persamaan regresi memiliki lebih dari satu variabel regresor disebut regresi berganda/multinomial regression. Pada bab ini akan diuraikan kembali tentang estimasi parameter, uji hipotesis dan pengukuranpengukuran kelayakan model beserta alternatif pengukuran koefisien korelasi ataupun determinasi pada model dengan lebih dari satu regresor. Sedangkan untuk penurunan rumus estimasi koefisien hanya membahas dua variabel bebas. 4.1 Bentuk umum persamaan regresi linear berganda Dengan dua variabel bebas (regresor) y = a+b1X1+b2X2 , sedangkan untuk lebih dari dua variabel bebas persamaan regresinya menjadi y = a+1X1+b2X2++bpXp Koefisien regresi Nilai a(intersept) dan b(slope/kemiringan) pada regresi berganda didapatkan dari formula :

Dengan : A = nX1y-(x1)(y) = nX22-(x2)2 C = n X1 X2-( X1) ( X2) D = n X2 Y-( X2) ( Y) E = n X12 ( X1)2 F = EB C2 Kesalahan standar estimasi (Se) Koefisien determinasi berganda

Dalam regresi berganda selain menguji koefisien determinasi, diperlukan pengujian lebih lanjut terutama terkait pengujian hipotesis koefisien regresi secara menyeluruh (uji signifikansi simultan / F

test). Perosedur pengujian sama dengan uji t namun diperlukan statistik F tabel sebagai pembanding : 4.2 Uji F (Signifikansi Simultan) Uji ini pada dasarnya menunjukkan seberapa jauh variabel bebas yang dimasukkan dalam model mempunyai pengaruh secara bersama-sama terhadap variabel terikat (Kuncoro, 2004 : 82). Hipotesis nol yang hendak di uji adalah apakah semua parameter dalam model sama dengan nol. H0 : 0 = 1 = .. = i = 0 Artinya apakah semua variabel secara simultan bukan merupakan variabel penjelas yang signifikan mempengaruhi dependent, karena Ho = 0 Ha : 0 1 . i 0 Jika f tabel berada pada daerah penerimaan Ha berarti secara simultan variabel penjelas signifikan mempengaruhi variabel dependen F hitung didapatkan dari formula sebagai berikut ;

MER SSR / k MSE SSE /(n k )

Dimana SSR = sum of square due to regression = ( -y)2 SSE = sum of square error = ( yi-i)2 n k = jumlah observasi = jumlah parameter (termasuk inteercept dalam model)

MSR = mean square due to regression = SSR/k MSE = mean of square due to error = SSE/(n-k) F tabel (:df1:df2) df1:(k-1) df2:(n-k) k:klasifikasi

4.3 Teorema gauss markov (uji asumsi kalsik) Jika model regresi linear memenuhi asumsi-asumsi berikut maka taksiran yang diperoleh akan BLUE : (i) (ii) (iii) (iv) E(u) = 0 setiap ui tidak pengaruhi Y Cov (ui,uj) = 0 ; ij covarian individu tidak sama, berarti tidak ada korelasi antar ui dan uj Var (ui Xi) = 2 sama untuk setiap I (homocedasticity) Cov (ui , Xi) = 0 berarti tidak ada korelasi antara ui dan Xi

(v)

Model dispesifikasi secara benar : Kesesuaian model dengan teori Variabel apa saja yang diperlukan Bagaimana bentuk fungsinya

Atau a. Variabel pengganggu konstan atau homokedastisitas (non heterokedastisitas) b. Tidak ada autokorelasi pada pengganggu c. Tidak ada korelasi linear (non multikolinearitas) diantara variabel independen d. Semua variabel berdistribusi normal

5 MODEL REGRESI DENGAN VARIABEL BEBAS KUALITATIF

Pada pembahasan regresi di bab-bab sebelumnya model regresi yang dibangun menggunakan variabel bebas yang bersifat kuantitatif. Pada pembahasan ini akan dijelaskan pembentukan model regresi dengan variabel bebas yang bersifat kualitatif,harga produksi pertumbuhan ekonomi merupakan contoh variabel dengan tipe data kuantitatif. Namun apabila sebuah analisis tentang respon perilaku gaji terhadap diskrimasi gender, maka variabel bebas jenis kelamin bertipe data kuantitatif.

5.1 Karakteristik variabel kualitatif Model-model regresi sebelumnya menggambarkan variabel dependen maupun variabel independen dijelaskan oleh variabel-variabel yang bersifat kuantitatif. Tapi dalam beberapa kasus kita temukan bahwa variabel-variabel banyak yang bersifat kualitatif baik pada data cross section ataupun time series. Misalkan jenis kelamin, lokasi, tingkat pendidikan, status perkawinan atau perubahan antar waktu. Variabel bentukan untuk data kualitatif disebut variabel Dummy/variabel boneka/dikotomi. Model regresi dengan variabel dummy disebut LSDV (linear square dummy variable). Metode ini adalah salah satu cara untuk mengkuantitatifkan atribut yang sifatnya kualitatif menjadi variabel yang sifatnya artifisial (dummy), variabel dummy membuat variabel bentukan baru/artitifisial dari data yang bersifat kualitatif menjadi atribut dengan nilai 0 dan 1 (biner).Model LSDV juga diasumsikan memiliki varian konstan,nilai harapan (expected value) atau rata-rata error adalah nol dan tidak ada korelasi serial antar error sesuai dengan asumsi OLS. Berbeda dengan model regresi dimana respon bersifat kuantitatif, garis regresi yang dibangun merupakan artifisial dari trend distribusi data/error yang bersifat tunggal. Namun pada model regresi dummy garis regresi yang dibentuk memiliki intersep yang berbeda tergantung dari atribut bentukannya. Misalkan pada model upah yang dihipotesiskan terpengaruh oleh perilaku gender memiliki hipotesis nol (Ho : =0) yang menjelaskan tidak adanya pengaruh dari jenis kelamin terhadap tingkat upah dan hipotesis alternatif (Ha : 0) jenis kelamin berpengaruh terhadap perbedaan tingkat upah. Model persamaan regresinya menjadi : Yi=0+ 1JKi+e menjadi model dummy Yi=0+ 1Di+e Dimana Y = gaji karyawan tahunan D = variabel dummy jenis kelamin bernilai 0 untuk perempuan dan 1 untuk laki-laki Apabila Ho ditolak (variabel D signifikan) maka Expected value (nilai rata-rata) untuk gaji karyawan : Karyawan laki-laki E(YD=1)= 0+ 1 Karyawan perempuan E(YD=0)= 0 Intersep (0) menunjukkan rata-rata gaji karyawan perempuan sedangkan slope 1 adalah perbedaan rata-rata gaji karyawan laki-laki dan perempuan, 0+1 merupakan rata-rata gaji karyawan laki-laki sebagaimana tergambar dalam grafik di bawah :

gaji

Gaji laki-laki 1 0+ 1 0 Jenis kelamin Gaji perempuan

Penggunaan variabel dummy Dalam menjelaskan prilaku perekonomian aktifitas dari pelaku ekonomi yang bersifat kualitatif dapat dijelaskan oleh variabel dummy dalam beberapa model bentukan : a) Variabel dummy menjelaskan perbedaan klasifikasi data pada tipe data cross section b) Variabel dummy menjelaskan perbedaan klasifikasi data cross section dengan lebih dari satu variabel bebas kualitatif,contoh analisis tingkat upah dengan variabel bebas jenis kelamin dan tingkat pendidikan c) Variabel dummy menjelaskan perbedaan klasifikasi data sebagai variabel kualitatif serta variabel bebas lain yang bersifat kuantitatif pada tipe data cross section d) Variabel dummy yang menjelaskan perbedaan atau perilaku data dengan pembeda trend waktu pada tipe data time series, misalkan sebuah analisis tentang skema perekonomian sebelum dan sesudah krisis e) Variabel dummy sebagai atribut komparatif baik pada cross section ataupun time series f) Variabel dummy sebagai atribut dimana data tersegmentasi 5.2 Pembentukan variabel dummy dengan lebih dari dua klasifikasi variabel Dalam beberapa kasus perilaku ekonomi seringkali digambarkan dalam klasifikasi data yang lebih kompleks,misalkan dalam analisis tingkat konsumsi dimana tingkat konsumsi merupakan respon dari variabel kualitatif tingkat pendidikan (tingkat pendidikan terklasifikasi lebih dari dua : SMU, Sarjana, pasca sarjana). Hipotesis nol menyatakana tidak ada perbedaan tingkat konsumsi atau pengeluaran akibat perbedaan tingkat pendidikan, sedangkan hipotesis alternatif menyatakan terdapat perbedaan. Model bentukan dari variabel diatas : Jumlah variabel dummy (D) = jumlah klasifikasi (M) 1 karena ada 3 kategori pendidikan maka jumlah variabel dummy D=3-1, D1=sarjana D2=pasca sarjana base point (selalu bernilai nol untuk SMU) Yi=0+ 1Xi+e menjadi model dummy Yi=0+ 1D1i+ 2D2 i +e Dimana Y = tingkat konsumsi, X = tingkat pendidikan, D1=dummy sarjana (1 untuk sarjana 0 tidak sarjana termasuk base point) D2=dummy pasca sarjana (1 untuk pasca 0 untuk yang lain termasuk base point)

Apabila Ho ditolak atau hipotesis alternatif yg menyatakan tingkat pendidikan berpengaruh terhadap tingkat konsumsi, maka expected value (nilai rata-rata tingkat konsumsi pada skem tingkat pendidikan yang berbeda) adalah : Rata-rata konsumsi sarjana E(YD1=1)= 0+ 1 Rata-rata konsumsi pasca sarjana E(YD2=1)= 0+ 2 Rata-rata konsumsi SMU E(YD=0)= 0

konsumsi pasca Sarjana 2 SMU

0 Tingkat pendidikan

6 PENGUJIAN ASUMSI-ASUMSI OLS

Pengujian asumsi OLS pada model regresi berganda (uji asumsi klasik) 1.1 MULTIKOLINEARITAS Hubungan linear antar variabel independen di dalam model disebut multikolinearitas, sementara untuk mendapatkan model yang BLUE disyaratkan tidak ada kolinearitas yang sempurna antar variabel bebas. Karena jika terjadi kolinearitas maka akan terdapat korelasi yang tinggi berakibat pada tingginya variansi parameter model. Perhatikan varian dan SE model pada regresi berganda berikut : var1 = 2/x1i2(1-r122) r : korelasi antara X1 dan X2 var2 = 2/x2i2(1-r122) r : korelasi antara X1 dan X2 SE (1/2) = var (1/2) ika terjadi multikolinearitas maka angka r juga akan tinggi, jika r mendekati 1 nilai dan SE menjadi tak terhinga (infinite). Akibat multikolinearitas : 1. estimator masih bersifat BLUE tapi variansi data besar 2. akibat no.1 maka interval estimasi juga akan cenderung melebar, sehinga t hitung akan kecil yang berdampak pada hasilan signifikansi model 3. nilai R2 tinggi dan tidak relevan dengan model dimana variabel bebas banyak yang tidak signifikan Cara mendeteksi multikolinearitas : 1. R2 tinggi tapi banyak variabel yang tidak signifikan 2. Korelasi parsial antar variabel independen, didapatkan dengan mencari nila r antara variabel bebas. Sebagai rule of thumb (ukuran kasar) jika terdapat angka r yang lebih dari 0.85 maka diduga model mengandung multikol. 3. Metode deteksi klien, langkah-langkahnya . First dapatkan R2 untuk masing hubungan antar vaiabel bebas (regresi antar variabel bebas/parsial). Bandingkan jika R2 > R2 model maka terdapat multikolinearitas. 4. Metode regresi auxiliary, dengan membandingkan nilai F pada masing-masing hasil regresi (parsial). Lalu nilai F yang dihasilkan dibandingkan dengan F tabel ((k-2);(n-k+1);), jika

signifikan (F>Ftabel) maka terdapat hubungan linear antar variabel bebas. Langkah untuk mendapatkan F hitung sebaga berikut ; R2 x1 x2 x3 xk / (k-2) F= 1-(R2 x1 x2 x3 xk )/ (n-k+1)

N : jumlah data k : klasifikasi (jumlah v.bebas termasuk konstanta) Cara menyembuhkan 1. Tanpa ada perbaikan : multikolinearitas tetap manghasilkan model yang BLUE, multikolinearitas hanya menyebabkan kita kesulitan mendapatkan error yang kecil. Masalah ini biasanya diakibatkan oleh jumlah observasi yang sedikit. Dalam konteks ini maka biasanya asumsi non multikolinearitas diabaikan. 2. Menghilangkan variabel independen yang menghasilkan korelasi/hubungn linear antar variabel yang kuat. 3. Transformasi variabel,menjadi bentuk differensial Yt = 0+ 1X1+ 2X2+ei diubah menjadi Yt Yt-1= 0+ (1X1-1xt-1)+ (2X2-2xt-1)+(et- et-1) model ini dikenal dengan bentuk diferensi pertama (first difference). 1.2 Heteroskedastisitas Metode OLS mengasumsikan bahwa residual (e/u) mempunyai rata-rata nol atau E(e)=0, mempunyai varian yang konstan var(e)=2 dan residual tidak saling berhubungan antara satu observasi dengan observasi yang lain cov(ei,ej)=0 sehingga menghasilkan estimator yang BLUE. Heteroskedastisitas adalah kondisi dimana varian tidak konstan atau (tidak homokedastisitas). Masalah ini biasanya terjadi terjadi pada tipe data cross section, pada fluktuasi data antar indiviu memiliki varian yang tinggi. Sedangkan pada data time series fluktuasinya stabil antar waktu. Sebagai contoh jika kita menganalisa prilaku penjualan pada perusahaan, maka kecenderungan penjualan perusahaan besar akan fluktuatif jika dibandingkan dengan perusahaan kecil. Kondisi ini mengakibatkan varian residualnya tidak stabil atau konstan, sementara metode OLS mensyaratkan model harus memenuhi taksiran yang BLUE. Jka model mengalami masalah heteroskedastisitas maka varian parameter estimasinya menjadi : var1 = xi22/(xi2)2 smentara modeltaksiran yang LUE var1 = 2/x1i2 ; varian konstan. Akibat heteroskedastisitas

1. Estmator metode OLS tidak mempunyai varian yang minimum lagi (no longer best) 2. Jika varian tidak minimum maka pehitungan SE metode OLS tidak bisa dipercaya kebenarannya 3. Akibat no 2 maka uji hipotesis maupun uji F tidak lagi bisa dipercaya kebenarannya. Cara mendeteksi 1. Metode informal, dengan metode grafik (sketergram) yakni dengan mendeteksi pola grafik antara variabel bebas dengan residual kuadrat (error). Jika kecenderungan residual kuadrat semakin meningkat seiring peningkatan variabel bebas maka model mengandung heterokedastisitas.

X
1

Residual kuadrat 2. Metode park, dengan meregres varian (2) dengan variabel bebas karena menurut R.E. Park heterokedastisitas muncul diakibatkan oleh residual yang tergantung pada variabel bebas. Jika hasil parameter yang dihasilkan signiffikan menurut uji t, maka model mengandung unsur heterokedastisitas. Bentuk transformasi model uji park sebagai berikut : ln2=ln1+ln2x1+ ln3x2 tetapi karena 2 merupakan residual (deviasi) populasi, 2 diproksi menjadi ei sehinga modelnya lne2=ln1+ln2x1+ ln3x2. 3. Metode glejser, sama dengan metode yang dikembangkan oleh R.E.Park yakni dengan meregres residual (diabsolutkan) dengan variabel bebas model. Bentuk transformasi model metode Glejser adalah sebagai berikut : e=1+2x1+ 3x2, jika parameter signifikan maka model mengandung heterikedastisitas. Cara penyembuhan 1. Metode GLS (Generalized Least Square), yakni membagi setiap variabel dengan : Y/ i=(1/ i)+(2x1/ i)+ (3x2/ i)+(e/ i)

2. Transformasi model, jika kita asumsikan model proporsional tehadap x maka transformasi modelnya menjadi (Y/xi)=(1/xi )+ (2x1/xi )+(3x2/xi)+(e/xi). 1.3 Autokorelasi Autokorelasi berarti terdapat korelasi antara observasi yang satu dan observasi yang lainnya dalam rentang waktu yag berlainan. Atau korelasi antar residual yang satu dan residual yang lainnya. Deteksi autokorelasi Metode yang paling umum digunakan adalah metode durbin watson dimana autokorelasi diketahui ada atau tidak pada model dengan membandingkan nilai durbin watson (DW) dengan DW tabel. Dimana nilai DW hitung diperoleh dari : d 2(1-) dimana =etet-1/et2. Lalu cari DW tabel dengan ketentuan DW(n;k) k=jumlah variabel bebas. Lalu ketentuan penilaian ada tidaknya autokorelasi dengan metode ini sesuai rule of thumb sebagai beriut : 0<d<dL dL ddu dud4- du 4- dud4-dL 4- dLd4 : menolak hipotesis nul/ada autokorelasi positif : daerah ragu-ragu ; tidak ada keputusan : menerima hipotesi nul ; tidak ada autokorelasi : daerah keragu-raguan ; tidak ada keputusan : menolak hipotesis nul ; ada autokorelasi negatif

Cara menyembuhkan 1. Transformasi model kedalam model autoregresif (model kelambaman) Yt-1= 0+ 1xt-1+ 2xt-1+ et-1 2. Transformasi model kedalam bentuk first difference Yt Yt-1= 0+ (1X1-1xt-1)+ (2X2-2xt1)+(et-

et-1) ini dilakukan jika koefisien autokorelasi sangat tinggi atau DW stat sangat rendah