P. 1
MODUL STATA - Ordinary Least Square (OLS) (2011)

MODUL STATA - Ordinary Least Square (OLS) (2011)

|Views: 6,168|Likes:
Dipublikasikan oleh Akbar Suwardi
Ekonometrika, STATA, Ordinary Least Square (OLS)
Ekonometrika, STATA, Ordinary Least Square (OLS)

More info:

Published by: Akbar Suwardi on Nov 22, 2011
Hak Cipta:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

10/19/2015

pdf

text

original

LABORATORIUM KOMPUTASI DEPARTEMEN ILMU EKONOMI

FAKULTAS EKONOMI UNIVERSITAS INDONESIA

MODUL

STATA: REGRESI LINEAR (OLS)CROSS SECTION (Edisi:2011)
Oleh : Akbar Suwardi

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Departemen Ilmu Ekonomi-FEUI Lt. 1, Depok Telp. (021) 78886252

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 I. Pengantar Regresi linear adalah teknik statistika yang memberikan pendugaan dari kemiringan suatu garis lurus (linear) dan posisi dimana garis tersebut memotong sumbu y, berdasarkan sejumlah informasi mengenai hubungan antar variabel. Memberikan pendugaan nilai a dan b, berdasarkan sejumlah informasi mengenai x dan y, pada persamaan berikut: y=a+b.x • x disebut variabel independent, karena nilainya tidak tergantung variabel lain. • • y disebut variabel dependent, karena nilainya tergantung nilai x. a dan b disebut parameter, a adalah intercept dan b adalah slope. REGRESI LINIER

Regresi linear sederhana, apabila variabel dependent hanya ditentukan oleh satu variabel independent. Contohnya: y = a + b.x + e. Sedangkan Jika Regresi Linear berganda, apabila variabel dependent ditentukan oleh lebih dari satu variabel independent. Contohnya: y = a + b1.x1 + b2.x2 + …. + bn.xn + e. Dimana, e = error term = perbedaan antara y aktual dengan y hasil estimasi garis regresi. Metode yang digunakan untuk mengestimasi parameter garis regresi disebut metode Ordinary Least Square (OLS). Metode ini meminimisasi jumlah dari error yang dikuadratkan dari setiap observasi. Pada dasarnya, model regresi dengan OLS dibangun atas asumsi CLRM (Classical Linier Regression Model). Asumsi tersebut memiliki properti sesuai dengan Gauss-Markov Theorem yang menuntut adanya karakteristik Best Linier Unbiassed dari penduga /estimatornya (Gujarati,2003), yakni: • Linier. Estimator OLS merupakan fungsi linier dari variabel acak (random). Contoh: variabel terikat Y dalam model regresi • Tidak Bias. Nilai rata-rata atau nilai ekspektasi dari estimator sama dengan nilai aktual/sesungguhnya,

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 1

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 • Varians Minimum. Estimator OLS memiliki nilai varians minimum. Kriteria ini penting untuk memastikan bahwa estimator efisien. Dengan kata lain, estimator yang tidak bias dengan varians terkecil dapat dikatakan sebagai estimator yang efisien. Atau lebih lengkapnya pada bab OLS di Gujarati (2003) ada 10 Asumsi Klasik regrsi Linera, yaitu: 1. Model linear dalam parameter. 2. Nilai x tetap dalam pengambilan sampel yang diulang. 3. Nilai rata-rata dari error sama dengan nol. 4. Homoskedastis yaitu nilai varians dari setiap error sama. 5. Tidak ada korelasi antar error. 6. Covarians antara ui dan xi adalah nol. 7. Banyaknya observasi n harus lebih besar daripada banyaknya parameter yang diestimasi. 8. Nilai dari xi harus bervariasi (tidak boleh sama). 9. Model regresi dispesifikasikan dengan benar. 10. Tidak ada multikolinearitas sempurna. Aplikasi pada program stata : Jika, data kita berupa Time Series, maka yang harus kitalakukan pertamakali adalah mengeset waktu. Missal variabel waktu di data kita adalah time, maka perintahnya adalah: tsset time Berikut adalah simulasi regresi linier (OLS) dari data states.dta, data ini diambil dari buku Lawrence C. Hamilton (Chapter6). Data tersebut merupakan data OLS- Cross Section, dimana data yang diambil berada pada tahun yang sama sedangkan akbarsuwardi@gmail.com STATA – Regersi Linear (OLS) | 2

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 memiliki Individu yang berbeda-beda. Dengan pertanyaan penelitian sebagai berikut: “Are SAT scores higher in states that spend more money on education controlling by other factors?”. Sedangkan, persamaan regresi 1:

csat = α + β1 exp ense + β 2 percent + β3income + β 4 high + β5college + ε

Dimana : csat expense percent income high college = SAT scores = Per pupil expenditure primary and secondary = % HS graduates taking SAT = Median household income = % adults with HS diploma = % adults college degree

1. Persiapan, Sebelum me Run data (sebelum Regress)  Indentifikasi hubungan garis lurus antara setiap variabel independent dan variabel dependent: Create scatter plot for each X and Y.

plot csat expense , plot csat percent

1

Model ini yang akan kita gunakan dalam mengolah data pada modul ini. Sedangkan data yang digunakan adalah data Cross Secion bukan Time Series, jadi dalam pengujian Asumsi OLS atau Uji BLUE pengujian untuk Autokorelasi tidak akan ditampilkan oleh penulis.

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 3

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
1093 M e a n + | * | | * | | * * c | * o | * * * * m | * ** * * p | * * * * o | * ** s | * * i | * t | * e | * * * * | * * S | * * * * * * A | * ** * * * ** T | * | 832 + ** * +----------------------------------------------------------------+ 2960 Per pupil expenditures prim&sec 9259

Cek partial corelation semua variabel independent dengan variabel dependent: corr csat expense percent income high college

|

expense

percent

income

high

college

-------------+--------------------------------------------expense | percent | income | high | college | 1.0000 0.6509 0.6784 0.3133 0.6400 1.0000 0.6733 0.1413 0.6091 1.0000 0.5099 0.7234 1.0000 0.5319 1.0000

Hasil diatas dapat membantu kita melihat hubungan partial antara variabel, dan yang perlu diperhatikan adalah hubungan antara Independent variabel dengan Dependent variabel (hubungannya positif atau negatif). Jika nilai hubungan antara Independent variabel dengan Dependent variabel sangatlah kecil, missal dibawah 0.001 maka sangat kecil pula variabel indepent tersebut mampu menjelaskan variabel Independent.  Melihat Deskriptif atau tipe dari data

describe csat expense percent income high college region

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 4

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
storage display variable name type format value label variable label

------------------------------------------------------------------------csat expense percent income high college region int int byte %9.0g %9.0g %9.0g Mean composite SAT score Per pupil expenditures prim&sec % HS graduates taking SAT Median household income, $1,000 % adults HS diploma % adults college degree region Geographical region

double %10.0g float float byte %9.0g %9.0g %9.0g

Deskriptif atau tipe dari data untuk membantu kita dalam melihat jenis data kita, dapat dilihat di storage type, sedangan kita juga dapat melihat apa variabel label yang kita gunakan. 

Cek Deskriptif Statistik data

summarize csat expense percent income high college region

Variable |

Obs

Mean

Std. Dev.

Min

Max

-------------+-------------------------------------------------------csat | expense | percent | income | high | 51 51 51 51 51 944.098 5235.961 35.76471 33.95657 76.26078 66.93497 1401.155 26.19281 6.423134 5.588741 832 2960 4 23.465 64.3 1093 9259 81 48.618 86.6

-------------+-------------------------------------------------------college | region | 51 50 20.02157 2.54 4.16578 1.128662 12.3 1 33.3 4

Sebelum kita melakukan regressi ada baiknya kita mengatahui dahulu berapa jumlah observasu, mean, Std.Deviasi, nilai Maximum dan Nilai Minimum data yang kita gunakan.

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 5

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 2. Melakukan Regressi  Model ke Satu : Menggunakan Dua Variabel Kita melakukan regresi sederhana, hanya 2 variabel. Dimana csat hanya dipengaruhi oleh expense. Csat adalah variabel Dependent, dan expense adalah variabel Independent.

regress csat expense
Source | SS df MS Number of obs = F( 1, 49) = = = 51 13.61 0.0006 0.2174 0.2015 59.814

-------------+-----------------------------Model | Residual | 48708.3001 175306.21 1 49 48708.3001 3577.67775

Prob > F R-squared

-------------+-----------------------------Total | 224014.51 50 4480.2902

Adj R-squared = Root MSE =

-----------------------------------------------------------------------------csat | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+---------------------------------------------------------------expense | _cons | -.0222756 1060.732 .0060371 32.7009 -3.69 32.44 0.001 0.000 -.0344077 995.0175 -.0101436 1126.447

Hasil estimasi kita menunjukkan bahwa, expense memiliki pengaruh negatif terhadap csat dengan signifikan (α=0.05). Berarti ketika expense naik satu satuan, maka nilai csat akan turun sebesar 0.222756 satuan. Sedangkan nilai Rsquared = 0.2174, yang berarti 21.74% variasi dari nilai variabel csat (Variabel Dependent) dapat dijelaskan oleh variasi nilai dari variabel expense (Variabel Independent).  Model ke Dua : Menggunakan Lebih dari Dua Variabel Kita melakukan regresi lebih komplek dengan variabel lebih dari 2. Dimana csat tidak hanya dipengaruhi oleh expense, namun juga oleh percent, income, high dan college. Csat adalah variabel Dependent, dan expense, percent, income, high dan college adalah variabel Independent. akbarsuwardi@gmail.com STATA – Regersi Linear (OLS) | 6

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 regress csat expense percent income high college

Source |

SS

df

MS

Number of obs = F( 5, 45) = = =

51 42.23 0.0000 0.8243 0.8048 29.571

-------------+-----------------------------Model | Residual | 184663.309 39351.2012 5 45 36932.6617 874.471137

Prob > F R-squared

-------------+-----------------------------Total | 224014.51 50 4480.2902

Adj R-squared = Root MSE =

-----------------------------------------------------------------------------csat | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+---------------------------------------------------------------expense | percent | income | high | college | _cons | .0033528 -2.618177 .1055853 1.630841 2.030894 851.5649 .0044709 .2538491 1.166094 .992247 1.660118 59.29228 0.75 -10.31 0.09 1.64 1.22 14.36 0.457 0.000 0.928 0.107 0.228 0.000 -.005652 -3.129455 -2.243048 -.367647 -1.312756 732.1441 .0123576 -2.106898 2.454218 3.629329 5.374544 970.9857

----------------------------------------------------------------------------------

Hasil estimasi kita menunjukkan bahwa, 1. Expense memiliki pengaruh negatif terhadap csat dengan tidak signifikan (P>|t|) < α (0.05). Berarti ketika expense naik satu satuan, maka nilai csat dapat turun sekitar .0033528 satuan, dengan asumsi bahwa variebel Independent lainnya tidak berubah, 2. Percent memiliki pengaruh negatif terhadap csat dengan signifikan (P>|t|) < α (0.05). Berarti ketika percent naik satu satuan, maka nilai csat akan turun sebesar 2.618177 satuan, dengan asumsi bahwa variebel Independent lainnya tidak berubah. 3. College memiliki pengaruh positif terhadap csat dengan signifikan (P>|t|) < α (0.05). Berarti ketika college naik satu satuan, maka nilai csat akan naik sebesar 2.030894 satuan, dengan asumsi bahwa variebel Independent lainnya tidak berubah, dan setrusnya. Sedangkan nilai R-squared = 0.8243, yang berarti 82.43% variasi dari nilai variabel csat (Variabel Dependent) dapat dijelaskan oleh variasi nilai dari variabel expense, percent, income, high dan college (Variabel Independent). akbarsuwardi@gmail.com STATA – Regersi Linear (OLS) | 7

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252  Model ke Tiga : Menggunakan Dummy Variabel Kita melakukan regresi yang sama seperti regrssi berganda sebelumnya namun menggunakan variabel region sebagai dummy, hanya 2 variabel. Dimana csat dipengaruhi oleh expense. Csat adalah variabel Dependent, dan expense, percent, income, high college dan Dummy adalah variabel Independent.

xi: regress csat expense percent income high college i.region

i.region

_Iregion_1-4

(naturally coded; _Iregion_1 omitted)

Source |

SS

df

MS

Number of obs = F( 8, 41) = = =

50 52.51 0.0000 0.9111 0.8937 21.492

-------------+-----------------------------Model | Residual | 194023.719 18937.6605 8 41 24252.9649 461.894159

Prob > F R-squared

-------------+-----------------------------Total | 212961.38 49 4346.15061

Adj R-squared = Root MSE =

-----------------------------------------------------------------------------csat | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+---------------------------------------------------------------expense | percent | income | high | college | _Iregion_2 | _Iregion_3 | _Iregion_4 | _cons | -.002021 -3.007647 -.1674421 1.814731 4.670564 69.45333 25.39701 34.57704 808.0206 .00424 .2328838 1.035771 1.184555 1.708108 14.95479 13.32343 9.5368 79.79478 -0.48 -12.91 -0.16 1.53 2.73 4.64 1.91 3.63 10.13 0.636 0.000 0.872 0.133 0.009 0.000 0.064 0.001 0.000 -.0105839 -3.477965 -2.259224 -.5775255 1.220969 39.25151 -1.510213 15.31709 646.8718 .0065419 -2.537329 1.924339 4.206988 8.120159 99.65514 52.30423 53.837 969.1694

------------------------------------------------------------------------------

Hasil estimasi kita menunjukkan bahwa, 1. Expense memiliki pengaruh negatif terhadap csat dengan tidak signifikan (P>|t|) < α (0.05). Berarti ketika expense naik satu satuan, maka nilai csat dapat turun sekitar 0.002021 satuan, dengan asumsi bahwa variebel Independent lainnya tidak berubah, 2. Percent memiliki akbarsuwardi@gmail.com STATA – Regersi Linear (OLS) | 8

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 pengaruh negatif terhadap csat dengan signifikan (P>|t|) < α (0.05). Berarti ketika percent naik satu satuan, maka nilai csat akan turun sebesar 3.007647 satuan, dengan asumsi bahwa variebel Independent lainnya tidak berubah. 3. College memiliki pengaruh positif terhadap csat dengan signifikan (P>|t|) < α (0.05). Berarti ketika college naik satu satuan, maka nilai csat akan naik sebesar 4.670564 satuan, dengan asumsi bahwa variebel Independent lainnya tidak berubah, 4. Variebl dummy , ketika Negara tersebut adalah region 2 dan nilai expense, percent, income, high dan college sama dengan 0, maka nilai csat sama 69.45333 + 808.0206 = 877.47393, dan setrusnya. Sedangkan nilai R-squared = 0.9111, yang berarti 91.11% variasi dari nilai variabel csat (Variabel Dependent) dapat dijelaskan oleh variasi nilai dari variabel expense, percent, income, high dan college (Variabel Independent).

3. Pemilihan Model Untuk mendapatkan model yang terbaik dari penelitian kita serta menilai variabel independent apa aja yang dimasukkan maka kita perlu melakukan pengujian. Seperti pengujian Ramsey Reset untuk melihat apakah ada variabel yang omitted dan pengujian menggunakan Akaike information criterion (AIC) dan Bayesian information criterion (BIC) dimana “smaller is better”. AIC dan BIC untuk melihat dari beberapa model ya mana yang lebih baik. a. Uji Ramsey Reset Ramsey regression adalah uji specification-error untuk omitted variables yang ditenukan oleh Ramsey (1969). Ramsey Reset mencoba melihat apakah Variabel Independent dalam model sudah cukup kita untuk menjelaskan akbarsuwardi@gmail.com STATA – Regersi Linear (OLS) | 9

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Variabel Dependentnya. Pada pengujian ini untuk mendapatkana nilai y yang tepat, y = xb + zt + u dan melakukan pengujian t = 0. Jika rhs option tidak diikut sertakan, maka powers of the fitted valuesnya hanya dari z. Jika rhs option diikut sertakan, maka powers of the individual element di x digunakan. Perintah untuk menggunakan pengujian Ramsey Reset di Stata adalah ovtest, rhs. Dengan Hipotesis : H0 : Model tidak memiliki Ommitted Variabel H1 : Model memiliki Ommitted Variabel Hipotesa nol akan ditolak bila (Prob>F) < α (0.005) atau nilai t-stat > nilai kritis t-tabel.  Model ke Satu : Menggunakan Dua Variabel regress csat expense (output omitted ) ovtest, rhs
Ramsey RESET test using powers of the independent variables Ho: model has no omitted variables F(3, 46) = Prob > F = 0.31 0.8192

Uji Ramsey Reset pada Model ke Satu menghasilkan nilai dari (Prob>F) > α (0.005), hal ini menandakan bahwa tidak ada cukup bukti bagi kita untuk menolak H0. Berarti Variabel Independent dalam model kesatu belum cukup untuk menjelaskan Variabel Dependentnya. Jadi masih butuh menambahkan variabel Independent.  Model ke Dua : Menggunakan Lebih dari Dua Variabel regress csat expense percent income high college (output omitted ) ovtest, rhs akbarsuwardi@gmail.com STATA – Regersi Linear (OLS) | 10

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Ramsey RESET test using powers of the independent variables Ho: model has no omitted variables F(21, 23) = Prob > F = 2.12 0.0408

Uji Ramsey Reset pada Model ke Dua menghasilkan nilai dari (Prob>F) < α (0.005), hal ini menandakan bahwa tidak ada cukup bukti bagi kita untuk menerima H0. Berarti Variabel Independent dalam model ke Dua sudah cukup untuk menjelaskan Variabel Dependentnya. Jadi tidak butuh lagi menambahkan variabel Independent.  Model ke Tiga : Menggunakan Dummy Variabel xi: regress csat expense percent income high college i.region (output omitted ) ovtest, rhs

Ramsey RESET test using powers of the independent variables Ho: model has no omitted variables F(15, 26) = Prob > F = 2.26 0.0331

Uji Ramsey Reset pada Model ke Tiga menghasilkan nilai dari (Prob>F) < α (0.005), hal ini menandakan bahwa tidak ada cukup bukti bagi kita untuk menerima H0. Berarti Variabel Independent dalam model ke Tiga sudah cukup untuk menjelaskan Variabel Dependentnya. Jadi tidak butuh lagi menambahkan variabel Independent. Dari ketiga test Ramsey Rest tersebut maka model yang dapat kita gunakan adalah model ke Dua dan ke Tiga. Dikarenakan tidak ada omitted variebel di

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 11

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 kedua model tersebut. Namun dalam Model yang digunakan dalam modul ini adalah model kedua, dimana model kedua ini masih sesuai dengan model awal kita dan masih sesuai untuk menjelaskan tujuan dari yang kita cari. b. Uji Akaike information criterion (AIC) dan Bayesian information criterion (BIC) Uji AIC dan BIC adalah pengujina yang popular utnk memebandingkan nilai maximum likelihood di model. berikut : AIC = -2*ln(likelihood) + 2*k BIC = -2*ln(likelihood) + ln(N)*k Dimana k = model degrees of freedom N = Jumlah dari observations Kita akan memilih model dari nilai AIC dan BIC lebih kecil, “smaller is better”. Misalnya dalam contoh pada modul kita ini, dimana kita mempunyai 3 model alaternatif, walaupun diawal kita sudah menjelaskan akan menggunakan model kedua. Berikut contohnya:  Model ke Satu : Menggunakan Dua Variabel regress csat expense (output omitted ) estat ic AIC dan BIC dapat didefiniskian sebagai

-------------------------------------------------------------------------Model | Obs ll(null) ll(model) df AIC BIC ----------+--------------------------------------------------------------. | 51 -286.2507 -279.9987 2 563.9974 567.861 --------------------------------------------------------------------------

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 12

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Model ke Dua : Menggunakan Lebih dari Dua Variabel regress csat expense percent income high college (output omitted ) estat ic

-------------------------------------------------------------------------Model | Obs ll(null) ll(model) df AIC BIC ---------+---------------------------------------------------------------. | 51 -286.2507 -241.9015 6 495.803 507.3939 --------------------------------------------------------------------------

Model ke Tiga : Menggunakan Dummy Variabel xi: regress csat expense percent income high college i.region (output omitted ) estat ic

-------------------------------------------------------------------------Model | Obs ll(null) ll(model) df AIC BIC --------+----------------------------------------------------------------. | 50 -279.868 -219.369 9 456.7381 473.9463 --------------------------------------------------------------------------

Terlihat bahwa nilai dari AIC dan BIC, pada Model Ke Satu > Model Ke Dua > Model Ke Tiga. Jadi bisa saja kita memlih model ke Tiga dalam model kita, Namun dalam Model yang digunakan dalam modul ini adalah model kedua, dimana model kedua ini masih sesuai dengan model awal kita dan masih sesuai untuk menjelaskan tujuan dari yang kita cari.

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 13

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 4. Evaluasi Hasil Regresi Dari ketiga regressi kita akan menggunakan regresi yang ke dua. Dimana regresi kedua sesuai dengan model awal kita. Walaupun hasil dari nilai Rsquared, Adjustd R-squared, Ramsey Reset, AIC, dan BIC lebih menunjukkan model ketiga (menggunakan dummy Region) lebih tepat. 2 4.1 Kriteria Ekonomi / Teori Lakukan evaluasi terhadap tanda dari slope, apakah sudah sesuai dengan teori. Jika belum, ada kemungkinan data yang digunakan dan spesifikasi model regresi salah. Misalnya pada model kita apakah benar secara teori atau Kriteria ekonomi bahwa expense memiliki hubungan positif dengan csat yang artinya ketika nilai expense kita naik maka nilai dari csat akan naik. Atau apakah benar hubungan income dengan csat adalah negative yang artinya ketika nilai income kita naik maka nilai dari csat akan turun. 4.2 Kriteria Statistik • Uji signifikansi serentak (F-Test). Uji ini untuk melihat secara global, apakah semua variabel bebas secara bersama-sama mempengaruhi variabel terikatnya. Hipotesanya sebagai berikut: H0 : β0 = β1 = β2 = β3 = β4 = ….. = βk = 0 H1 : β0 ≠ β1 ≠ β2 ≠ β3 ≠ β4 ≠ ….. = βk ≠ 0 Hipotesa nol akan ditolak bila (Prob > F) < α atau nilai t-stat > nilai kritis t-tabel. Dalam konteks model kita, uji global F dapat membuktikan apakah benar variabel expense, percent, income, high dan college secara bersama-sama mempengaruhi variabel csat. Pada output diatas nilai dari

2

Dikembalikan pada model atau pada sesuatu yang kita cari

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 14

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 (Prob > F) = 0. Berarti (Prob > F) < α (0.05), maka kita tidak cukup bukti untuk menerima H0, yang berarti semua variabel independent tersebut mampu menjelaskan atau mempengaruhi variabel dependent. • Uji signifikansi parsial (t-test). Uji ini untuk melihat secara individual, apakah masing-masing variabel bebas secara signifikan berpengaruh terhadap variabel terikat. Hipotesanya sebagai berikut: H0 : βk = 0 H1 : βk ≠ 0 Hipotesa nol akan ditolak bila (P>|t|) < α atau nilai t-stat > nilai kritis ttabel. Dalam konteks model kita, uji global F dapat membuktikan apakah benar variabel expense, percent, income, high dan college secara bersamasama mempengaruhi variabel csat. Pada output diatas nilai dari (Prob > F) = 0. Berarti (P>|t|) < α (0.05). maka kita tidak cukup bukti untuk menerima H0 yang berarti semua variabel independent tersebut mampu menjelaskan atau mempengaruhi variabel dependent. • Uji Goodness of Fit. Uji ini untuk mengukur seberapa besar variasi dari nilai variabel terikat (Variabel Dependent) dapat dijelaskan oleh variasi nilai dari variabel-variabel bebasnya (Variabel Independent). Langkahnya adalah dengan melihat R-squared dari hasil regresi estimasi. Dalam hasil estimasi kita menggunakan model kedua, kita mendapatkan nilai dari Rsquared adalah 0.8243 artinya 82.43% variasi dari nilai variabel csat (Variabel Dependent) dapat dijelaskan oleh variasi nilai dari variabel expense, percent, income, high dan college (Variabel Independent).

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 15

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 4.3 Kriteria Ekonometrika a. Bebas dari Multicollinearitas b. Bebas dari Heteroskedastisitas c. Bebas dari Autokorelasi 5. Evaluasi Hasil Pelanggaran Asusmsi OLS dan Penanggulangannya 3 a. Uji Multicollinearitas Didalam asumsi BLUE, antar variabel tidak ada hubungan exact collinearity antar variabel independen. Jika ada maka OLS meskipun BLUE namuan estimator akan mempunyai nilai varians dan covarians yang besar, makan akan sulit untuk menentukan estimasi yang benar. I. Deteksi :
2

i. ii. II.

Nilai R tapi sangan sedikit variabel yang signifikan. High pair-wise (zero-order) correlations among regressors Test Multicollinearitas :

i. Examination of partial correlations : Untuk Pearson correlation coefficient, digunakan perintah : correlate varnames, Contoh :
Jika data yang kita gunakan adalah data TIME SERIES maka pengujian Stasionaritas dengan menggunakan Pengujian Unit Root Dengan DF Test dan Pengujian Unit Root Dengan ADF Test perlu dilakukan. Namun ada juga pendapat yang menyatakan bahwa untuk OLS TIME SERIES, uji Stasionaritas serta koentegrasi tidak perlu dilakukan. Pada Modul ini penulis tidak melakukan uji-uji tersebut.
3

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 16

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

corr expense percent income high college
| expense percent income high college

-------------+--------------------------------------------expense | percent | income | high | college | 1.0000 0.6509 0.6784 0.3133 0.6400 1.0000 0.6733 0.1413 0.6091 1.0000 0.5099 0.7234 1.0000 0.5319 1.0000

Intepretasi : Dengan rule of thumb 0.8 atau 0.75, maka jika nilai pearson correlation antar dua variabel lebih dari itu, mengindikasikan bahwa dua variable itu memiliki hubungan yang kuat (ada multicollinearitas) ii. Tolerance and variance inflation factor (VIF) : regress csat expense percent income high college (output omitted ) vif
Variable | VIF 1/VIF -------------+---------------------income | college | percent | expense | high | 3.21 2.73 2.53 2.24 1.76 0.311756 0.365683 0.395603 0.445673 0.568732

-------------+---------------------Mean VIF | 2.49

Intepretasi : Jika nilai VIF lebih besar dari 10 atau tolerance (1/VIF) adalah .01 atau kurang, mengindikasikan adanya multicollinearitas. Maka berdasarkanhasil diatas, data kita tidak ada variabel yang multicollinearitas yang kuat.

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 17

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

III.

Koreksi : Do nothing If the main purpose of modeling is predicting Y only, then don’t worry. (since ESS is left the same) “Don’t worry about multicollinearity if the R-squared from the regression exceeds the R-squared of any independent variable regressed on the other independent variables.” First difference, dibuat First difference pada salah satu variabel yang bermasalah multicol, pada stata dapat dilakukan dengan perintah: gen [nama variabel first difference] = D.[variabel awal] contoh : gen fdx1= D.x1

Diubah rumus dalam mendapatkan variabel tersebut, dapat diubah menjadi ln atau dibuat selisih antar waktu Menambah jumlah data Hilangkan salah satu variabel yang berkaitan erat, dapat dilihat pada perinta corr, yaitu Pearson correlation coefficient yang lebih dari 0.8 atau 0.75

 

b. Uji Heteroskedastisitas Ketika terjadi heteroscedastisitas OLS estimators akan unbiased karena hasil estimator akan mempunyai pergeakan error yang berpola,Oleh karena itu OLS tidak tidak efisien, dan S.E. biased.

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 18

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 i.  Deteksi : Residual vs fitted plots Residual vs fitted plots merupakan prosedur grafik untuk melihat apakah ada pola antara nilai residual (error) dan fitted values (predicted values) hasil estimasi regresi. Grafik ini juga dapat menjadi indicator awal terhadinya heteroskedastisitas dalam model ekonometrik. Model ekonometrik yang baik adalah jika residual vs fitted value plot tidak menunjukkan sebuah pola. Residual vs fitted plot dapat dibuat dengan perintah: rvfplot, yline(0) Contoh: Kita melakukan perintah regresi terlebih dahulu: regress csat expense percent income high college (output omitted ) rvfplot, yline(0) Maka akan menghasilkan grafik sebagai berikut :

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 19

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
100 Residuals -50 0 50

850

900

950 Fitted values

1000

1050

Estimasi yang kita lakukan memilki nilai kesalahan (error) yang hetero atau tidak dapat dilihat ketika nilai error kita tersebut tersebar diantar suatu range. Misalnya, seperti output diatas bahwa persebaran nilai error kita diantara range -50 sampe 50 (sebagian besar) maka dapat kita simpulkan bahwa persebaran nilai error kita homokedastis. Namun, untuk lebih meyakinkan kita dapat melakukan uji Heteroskedastisitas lebih lanjut, misalnya dengan Breusch-Pagan / Cook-Weisberg test. ii.  Test Heteroskedastisitas : Dalam estimasi menggunakan data cross section, masalah yang umum timbul adalah heteroskedastisitas atau varians residual yang tidak seragam. Salah satu metode untuk menguji adanya heteroskedastisitas dalam ekonometrik adalah Cook and Weisberg’s test. Stata dapat melakukan pengujian ini dengan perintah hettest [varlist] [,rhs] atau szroeter [varlist] [,rhs] setelah melakukan regresi.  Hipotesis: ρ H0 : Constant Variance H1 : NO Constant Variance akbarsuwardi@gmail.com STATA – Regersi Linear (OLS) | 20

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Keputusan: Tolak H0, Jika Jika p-value < 5% Contoh: Kita melakukan perintah regresi terlebih dahulu:

atau

regress csat expense percent income high college (output omitted ) hettest Maka akan muncul output sebagai berikut:
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of csat chi2(1) Prob > chi2 = = 0.01 0.9087

Intepretasi : Berdasarkan hasil uji Breusch-Pagan / Cook-Weisberg, dimana nilai Prob > chi2 = heteroskedastisitas. iii.  Koreksi : Ketika variance diketahui: gunakan WLS method reg csat* expense* percent*.... noconstant cf. csat* = cssat/δ , expense* = expense /δ   Transformasi logaritma Robust 0.9087, lebih besar dari alfa (0.05) maka dapat disimpulkan bahwa estimasi kita terbebas dari masalah

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 21

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 regress csat expense percent income high college, robust
Linear regression Number of obs = F( 5, 45) = = = = 51 50.90 0.0000 0.8243 29.571

Prob > F R-squared Root MSE

----------------------------------------------------------------| csat | Coef. Robust Std. Err. t P>|t| [95% Conf. Interval]

-------------+--------------------------------------------------expense | .003352 .004781 0.70 0.487 -.0062766 -3.079123 -2.325933 -.2690989 -2.226502 736.1821 .0129823 -2.15723 2.537104 3.530781 6.28829 966.9477

percent |-2.618177 income high | .105585

.2288594 -11.44 0.000 1.207246 .943318 2.113792 57.28743 0.09 0.931 1.73 0.091 0.96 0.342 14.86 0.000

| 1.630841

college | 2.030894 _cons | 851.5649

Perintah

robust

tersebut

akan

secara

otomatis

menghilangkan

heteroskedastisitas dengan jalan membobotkan dengan robust standar eror. Hasil regresi yang didapat telah dapat dipastikan telah terbebas dari heteroskedastisitas. c. Uji Autokorelasi Autokorelasi suatu keadan dimana terjadi korelasi eror antar periode waktu. Adanya autokolareasi akan membuat OLS linear unbiased, consistent dan asymptotically normally distributed dan tidak lagi efficient (tidak varians minimum tdk BLUE). Autokorelasi umumnya terjadi pada data time series, sebelum melakukan regresi kita harus mendefinisikan terlebih dahulu time variable kita dengan perintah tsset [timevar].

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 22

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

I. 

Deteksi : Create plot regress csat expense percent income high college (output omitted ) predict resi, resi gen lagged resi = resi[_n-1] plot resi lagged resi

Error saat ini (t), memilki hubungan dengan error sebelumnya (t-1), atau errosr saat sebelumnya (t-2), dst. ini memiliki hubungan dengan error-error

II. Test Autokorelasi 4 :  Durbin Watson statistic  Hipotesis: ρ= H0 : Tidak ada Autokorelasi H1 : Ada Autokorelasi  Keputusan : Jika nilai DWstat disekitar 2 atau 1,54<Dwstat<2,5 maka tidak ada cukup bukti untuk menolak H0

Menginat data yang digunakan ini bukanlah data time series, maka penulis tidak dapat memberikan contoh output pada setiap pengujian. Jadi hanya Ilustrasi, Autokorelasi hanya ada pada data kita yang bersifat TimeSeries.

4

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 23

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Contoh: regress csat expense percent income high college (output omitted ) Dwstat  Breusch–Godfrey (BG) Test / LM test  Hipotesis: ρ H0: ρ1 = ρ2 = ρ3 = Tidak Ada Autokorelasi H1 : Ada Autokorelasi  Keputusan: Tolak H0, Jika atau

Jika p-value < 5% Contoh: regress csat expense percent income high college (output omitted ) bgodfrey III. Koreksi :  Menggunakan metode GLS (Generalized Least Squares)

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 24

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Estimate ρ: ρ = 1 – d/2 (D-W ) or ρ = n (1- d/2) + k /n –k (TheilNagar) Regress dengan transformed variables dan dapatkan new d statistic. Compare it with dLcritical and dUvalues First difference, dibuat First difference pada salah satu variabel yang bermasalah multicol, pada stata dapat dilakukan dengan perintah: gen [nama variabel first difference] = D.[variabel awal] Contoh : gen fdx1= D.x1

2

2

2

2

Perhitungan Prais-Winsten and Cochrane-Orcutt regression (Prais) Prais menggunakan metode Generalized Least Squares (GLS) untuk mengestimasi parameter di dalam model linear regression model, yang mana errornya mempunyai serial korelasi. Namun Prais mengasumsikan error yang terkolerasi pada first order atau dapat diakatakan Prais hanya mampu menyelesaikan masalah Autokorelasi pada first order saja. pada stata dapat dilakukan dengan bentuk perintah: prais contoh : prais csat expense percent income high college Perintah prais akan secara otomatis menghilangkan autokorelasi dengan jalan menambahkan variabel autoregresion dengan lag yang ditentukan oleh program stata. Hasil regresi yang didapat telah dapat dipastikan telah terbebas dari autokorelasi. [dependen variabel] [independent variabel]...[variabel independent ke-n].

Menambah variabel autoregressif (ar) STATA – Regersi Linear (OLS) | 25

akbarsuwardi@gmail.com

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Menambahkan lag dependent variabel atau menambah lag pada variabel independent.

d. Testing Normality of residuals

regress csat expense percent income high college (output omitted ) predict e, resid pnorm e

0.00
0.00

0.25

Normal F[(zr-m)/s] 0.50 0.75

1.00

0.25

0.50 Empirical P[i] = i/(N+1)

0.75

1.00

Ketika titik – titik kita teratur seperti diatas, maka dengan visual kita dapat menyimpulkan residual dari estimasi kita distribusi secara normal. Namun, jika kita tidak yakin maka kita dapat melakukan pengujian Shapiro-Wilk and Shapiro-Francia tests for normality, dengan perintah:

Swilk e

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 26

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Shapiro-Wilk W test for normal data

Variable |

Obs

W

V

z

Prob>z

-------------+-------------------------------------------------e | 51 0.96960 1.452 0.797 0.21281

H0 : error term terdistribusi normal. H1 : error term tidak terdististribusi normal. Dimana, ketika nilai Prob>z lebih kecil dari alfa ( α ), maka variabel tidak terdistribusi secara normal. Untuk pengujian diatas karena nilai Prob>z = 0.21281, maka dapat disimpulkan bahwa residual (e) terdistribusi secara normal.

Tambahan!
 Prais-Winsten and Cochrane-Orcutt regression dan Robust Pada Stata cara menggunakan dapat menghilangkan masalah Heterosekdasitas dan Autokorelasi secara langsung dengan menggabungkan perintah prais dan robust. Dengan bentuk perintah: prais [variabel dependent] [variabel independent]…[variabel independent ke-n], robust. Contoh: prais csat expense percent income high college, robust (output omitted ) Gabungan perintah prais dan robust akan secara otomatis menghilangkan Heterosekdasitas dan Autokorelasi pada model kita tersebut.

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 27

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252  Uji Cameron & Trivedi's regress csat expense percent income high college (output omitted ) estat imtest Cameron & Trivedi's decomposition of IM-test
--------------------------------------------------Source | chi2 df p

---------------------+----------------------------Heteroskedasticity | Skewness | Kurtosis | 18.57 7.74 0.35 20 5 1 0.5499 0.1710 0.5524

---------------------+----------------------------Total | 26.67 26 0.4270

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 28

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

DAFTAR PUSTAKA Gujarati, Damodar. 2006. Basic Econometrics. McGraw-Hill. Glick, R., and Andrew Rose. 2001. Does a Currency Union affect Trade? The Time Series Evidence. European Economic Review. Hamilton, L. 20 06. Statistics With STATA: Updated for Version9. Belmont: Duxbury Thomson Learning. Harris, Mark and Laszlo Matyas. 1998. The econometrics of gravity models. Melbourne Institute Working Paper no 5/98. Melbourne Institute of Applied Economic and Social Research. Manual Stata 11. 2009. Stata Press Publication, College Station, Texas https://dss.princeton.edu/ https://www.ats.ucla.edu/

“Jika ada kritik dan saran atas modul ini, silahkan email ke akbarsuwardi@gmail.com Segala kritik dan saran sangat berharga bagi penulis. ”

akbarsuwardi@gmail.com

STATA – Regersi Linear (OLS) | 29

You're Reading a Free Preview

Mengunduh
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->