Anda di halaman 1dari 6

3.

3 PRESISI DAN STANDAR ERROR ESTIMASI LEAST-SQUARE


Dari persamaan 3.1.6 dan 3.1.7, membuktikan bahwa estimasi least square adalah fungsi dari
data sample. Namun karena data cenderung berubah-ubah maka estimasi juga akan ikut berubah.
Oleh karena itu, yang diperlukan adalah ukuran "keandalan" atau presisi penduga ˆ β1 dan ˆ β2.
Dalam statistik ketepatan estimasi diukur dengan standart error (se). Gaussian berasumsi bahwa
standart error dari estimasi OLS dpat diperoleh sebagai berikut. :

Dimana :
Var = varians
Se = standart error
σ2 = konstanta

Semua jumlah yang masuk ke dalam persamaan sebelumnya kecuali σ2 dapat diperkirakan dari
data.σ2 sendiri diperkirakan dengan rumus berikut:

dimana adalah estimasi yang sebenarnya tetapi tidak diketahui σ2 dan dimana n-2 diketahui
sebagai nilai Degrees of Freedom (df). Menjadi jumlah dari residual square atau Residual
Sum of Square (RSS).
Ketika diketahui, σ2 bisa lebih mudah dihitung. Itu sendiri bisa dihitung dari rumus
pada 3.1.2 atau dari persamaan dibawah ini :
Membandingkan dengan persamaan 3.1.2, persamaan 3.3.6 mudah digunakan, untuk itu tidak
memerlukan ûi untuk masing-masing observasi meskipun beberapa perhitungan akan berguna
pada observasinya.

Perhitungan alternative untuk adalah :

Sekilas, perhatikan bahwa akar kuadrat positif dari σ2

dikenal sebagai standar kesalahan estimasi atau standar kesalahan regresi (se). Ini hanyalah deviasi
standar dari nilai-nilai Y tentang garis regresi yang diperkirakan dan sering digunakan sebagai
ukuran ringkasan dari "goodness of fit" dari garis regresi yang diperkirakan.

3.4 SIFAT ESTIMASI KUADRAT TERKKECIL : TEORI GAUSS-MARKOV


Seperti disebutkan sebelumnya, dengan asumsi model regresi linier klasik, kuadrat terkecil
memiliki beberapa sifat ideal atau optimal. Properti ini terkandung dalam teorema Gauss – Markov
yang terkenal. Untuk memahami teorema ini, kita perlu mempertimbangkan properti linear
linearity terbaik dari estimator.18 Seperti dijelaskan dalam Lampiran A, estimator, katakanlah
estimator OLS β2, dikatakan sebagai estimator linear bias terbaik (BLUE) dari β2 jika penahanan
berikut:
1. Ini linier, yaitu fungsi linear dari variabel acak, seperti variabel dependen Y dalam model
regresi.
2. Tidak bias, yaitu nilai rata-rata atau yang diharapkan, E (β2), sama dengan nilai sebenarnya,
β2.
3. Memiliki varians minimum di kelas semua penaksir linier yang tidak memihak tersebut;

Impor penuh teorema Gauss-Markov akan menjadi lebih jelas saat kita bergerak bersama. Cukup
untuk dicatat di sini bahwa teorema memiliki kepentingan teoretis dan praktis. Semua ini dapat
dijelaskan dengan bantuan Gambar 3.7.
Pada Gambar 3.7 (a) kami telah menunjukkan distribusi sampling dari estimator OLS ˆ β2, yaitu
distribusi nilai yang diambil oleh ˆ β2 dalam eksperimen pengambilan sampel berulang (ingat
Tabel 3.1).
Untuk kenyamanan kita mengasumsikan ˆ β2 untuk didistribusikan secara simetris (tetapi lebih
pada ini dalam Bab 4). Seperti yang ditunjukkan oleh gambar, rata-rata nilai ˆ β2, E (ˆ β2), sama
dengan β2 yang sebenarnya. Dalam situasi ini kita mengatakan bahwa ˆ β2 adalah penduga yang
tidak bias dari β2. Pada Gambar 3.7 (b) kami telah menunjukkan distribusi sampling β ∗ 2, penaksir
alternatif β2 yang diperoleh dengan menggunakan metode yang lain.

3.5 KOEFISIEN DETERMINASI (R2) : PENGUKURAN DARI “GOODNESS OF FIT”


Sejauh ini kami difokuskan dengan masalah koefisien regresi, standart error, dan beberapa
sifat. Kami sekarang mempertimbangkan goodness of fit dari garis regresi pas untuk satu set data;
yaitu, kita harus mencari tahu seberapa "baik" garis regresi sampel cocok dengan data. Dari
Gambar 3.1 jelas bahwa jika semua pengamatan terletak pada garis regresi, kita akan mendapatkan
kecocokan "sempurna", tetapi ini jarang terjadi. Secara umum, akan ada beberapa ˆu i positif dan
beberapa ˆu i positif. Yang kami harapkan adalah residu ini di sekitar garis regresi sekecil mungkin.
Koefisien determinasi r 2 (kasus dua variabel) atau R2 (regresi berganda) adalah ukuran ringkasan
yang menunjukkan seberapa baik garis regresi sampel sesuai dengan data. Sebelum kita
menunjukkan bagaimana r 2 dihitung, mari kita pertimbangkan penjelasan heuristik dari r 2 dalam
hal perangkat grafis, yang dikenal sebagai diagram Venn, atau Ballentine, seperti yang ditunjukkan
pada Gambar 3.8.2.

Dalam gambar ini lingkaran Y mewakili variasi dalam variabel dependen Y dan lingkaran X
mewakili variasi dalam variabel penjelas X.21 Tumpang tindih dari dua lingkaran (area yang
diarsir) menunjukkan sejauh mana variasi dalam Y dijelaskan oleh variasi dalam X (katakanlah,
melalui regresi OLS). Semakin besar tingkat tumpang tindih, semakin besar variasi dalam Y
dijelaskan oleh X. R2 hanya merupakan ukuran numerik dari tumpang tindih ini. Pada gambar,
ketika kita bergerak dari kiri ke kanan, area tumpang tindih meningkat, yaitu, berturut-turut
proporsi variasi Y yang lebih besar dijelaskan oleh X. Singkatnya, R2 meningkat.

3.6 CONTOH NUMERIK


Kami menggambarkan teori ekonometrik yang dikembangkan sejauh ini dengan mempertimbangkan
data yang diberikan pada Tabel 2.6, yang berhubungan dengan upah per jam rata-rata (Y) dan tahun sekolah
(X). Teori ekonomi tenaga kerja dasar memberi tahu kita, bahwa di antara banyak variabel, pendidikan
merupakan penentu penting upah. Pada Tabel 3.2 kami menyediakan data mentah yang diperlukan untuk
memperkirakan dampak kuantitatif pendidikan terhadap upah.
Dari data yang diberikan pada table, kami menyatakan bahwa estimasi regressi adalah sebagai
berikut “
Yˆi = −0.0144 + 0.7240Xi

Secara geometris, garis estimasi regresi adalah seperti yang ditunjukkan pada gambar diatas. Seperti yang
kita ketahui, setiap titik pada garis regresi memberikan perkiraan nilai rata-rata Y yang sesuai dengan nilai
X yang dipilih, yaitu, Yˆ i adalah perkiraan E (Y | Xi). Nilai β ˆ2 = 0,7240, yang mengukur kemiringan
garis, menunjukkan bahwa, dalam rentang sampel X antara 6 dan 18 tahun pendidikan, saat X meningkat
sebesar 1, perkiraan kenaikan upah rata-rata per jam adalah sekitar 72 sen . Artinya, setiap tahun tambahan
sekolah, rata-rata, meningkatkan upah per jam sekitar 72 sen. Nilai β ˆ 1 = −0.0144, yang merupakan
intersep garis, menunjukkan tingkat upah rata-rata ketika tingkat pendidikan nol. Penafsiran harfiah seperti
intersep dalam kasus ini tidak masuk akal. Bagaimana mungkin ada upah negatif? Seperti yang akan kita
lihat di seluruh buku ini, sangat sering istilah intersep tidak memiliki makna praktis yang layak. Selain itu,
tingkat pendidikan nol tidak dalam tingkat pendidikan yang diamati dalam sampel kami. Seperti yang akan
kita lihat di Bab 5, nilai intersep yang diamati tidak berbeda secara statistik dari nol. Nilai r2 sekitar 0,90
menunjukkan bahwa pendidikan menjelaskan sekitar 90 persen variasi dalam upah per jam.
Mempertimbangkan bahwa r 2 bisa paling banyak 1, garis regresi kami sangat cocok dengan data. Koefisien
korelasi, r = 0,9521, menunjukkan bahwa upah dan pendidikan berkorelasi sangat positif. Sebelum kita
meninggalkan contoh kita, perhatikan bahwa model kita sangat sederhana. Teori ekonomi tenaga kerja
memberi tahu kita bahwa, selain pendidikan, variabel seperti jenis kelamin, ras, lokasi, serikat pekerja, dan
bahasa juga merupakan faktor penting dalam penentuan upah per jam. Setelah kami mempelajari regresi
berganda pada Bab 7 dan 8, kami akan mempertimbangkan model penentuan upah yang lebih luas.

Anda mungkin juga menyukai