Module 1
Module 1
of OLS
Konten
1. Bagaimana regresi (OLS) dilakukan?
2. Asumsi Gauss Markov: BLUE
1. Linearity in Parameter
2. Random Sampling
3. No Perfect-Multicollinearity
4. Exogeneity (Zero Conditional Mean)
5. Homoskedasticity
3. Jenis-jenis data
4. Post-tutorial Assignment
Bagaimana regresi (OLS) dilakukan?
• Mengetahui hubungan antara 2 buah variabel memberikan manfaat
di berbagai aspek kehidupan dalam proses decision-making
• Aspek Bisnis: Mengetahui hubungan iklan dengan jumlah sales
• Aspek Kepemerintahan: Mengetahui hubungan jumlah pajak barang
konsumsi dengan perilaku konsumsi masyarakat
• Aspek Lainnya: Mengetahui hubungan pengalaman kerja dengan
gaji yang diterima
• Lalu, bagaimana regresi dilakukan sehingga bisa bermanfaat?
Bagaimana regresi (OLS) dilakukan?
webuse nlswork
regress ln_wage ttl_ex
Bagaimana intepretasinya?
Bagaimana regresi (OLS) dilakukan?
sort ln_wage ttl_exp
twoway (scatter ln_wage ttl_exp,
mcolor(%50)) (lfit ln_wage
ttl_exp) if (age==30)
Bagaimana intepretasinya?
Bagaimana membedakan
asosiasi dan kausalitas?
Melalui teori dan pembuktian
empiris
Asumsi OLS: Unbiased Parameter
• Pemerintah Indonesia melaksanakan Program Keluarga Harapan
(PKH), program bantuan tunai bersyarat, untuk 10% masyarakat
termiskin
• PKH bertujuan untuk melonggarkan kendala anggaran rumah
tangga miskin sehingga mereka dapat membelanjakan lebih banyak
untuk anak-anak mereka
• Tujuan PKH adalah untuk meningkatkan kesehatan dan hasil
pendidikan anak-anak dari rumah tangga miskin
Asumsi OLS: Unbiased Parameter
• Pemerintah ingin mengestimasi pengaruh PKH terhadap tinggi
badan anak menggunakan metrik tinggi badan menurut usia (HAZ)
WHO.
• Dengan menggunakan data administratif dan survei, seorang
peneliti menulis spesifikasi ekonometrika sebagai berikut:
height i = 𝛽0 + 𝛽1 𝑃𝐾𝐻𝑖 + 𝑢𝑖
Yang mana
• 𝑃𝐾𝐻𝑖 =1 jika rumah tangga i menerima PKH, 0 jika tidak
• Bagaimana mengestimasi 𝛽1 ?
Asumsi Gauss Markov
Linearity in Parameter
Korelasi ini kita sebut sebagai perfect correlation. Mari kita coba untuk
menggunakan kedua variabel yang berkorelasi sempurna dalam regresi
regress ln_wage age age_sq ttl_exp tenure hours grade nev_mar ev_mar
Asumsi Gauss Markov
Exogeneity (Zero Conditional Mean)
Eksogenitas atau zero conditional mean merupakan kondisi dimana
error term tidak berkorelasi dengan variabel independent dalam model
regresi
height i = 𝛽0 + 𝛽1 𝑃𝐾𝐻𝑖 + 𝑢𝑖
gen Y = 4*X + U
sample 10
regress Y X
predict uhat, resid
scatter uhat z
Asumsi Gauss Markov
Homoskedasticity
Visualisasi Heteroskedasticity
regress ln_wage age age_sq ttl_exp tenure hours grade nev_mar
estat hettest
estat imtest, white
Impact?
Impact?
Training
program
sebelum sesudah
Ulasan: Masalah Dasar Evaluasi; Kerangka Kerja
Potensi Hasil (Potential Outcome Framework)
2) Masalah Kerangka Kerja Potensi Hasil
• Hasil potensial dapat ditulis sebagai:
• di mana Y1i adalah hasil jika seseorang (i) menerima program, dan Y0i
adalah hasilnya jika dia (i) tidak menerima program
• Kausalitas dari program/kebijakan tersebut adalah: (Y1i -Y0i)
• Tidak dapat dicapai. Mengapa?
Ulasan: Masalah Dasar Evaluasi; Kerangka Kerja Potensi Hasil
(Potential Outcome Framework)
• Perlu dicatat bahwa kita tidak pernah dapat melihat kedua hasil untuk
satu individu (tidak ada dunia paralel & tidak ada kontrafaktual).
Mengapa? Missing data problem
idealnya
Ulasan: Masalah Dasar Evaluasi; Kerangka Kerja Potensi Hasil
(Potential Outcome Framework)
Nyatanya
*dalam dimensi waktu yang sama
Skenario 1 (biru; tidak mendapat treatment) & 2
(hitam; treatment)
Jumlah
goal
Impact?
Training
program
Solusi: Estimasi Konterfaktual/Kontrafaktual
Idealnya:
Skenario 1 (biru; mendapat treatment) & 2 (hitam; tidak
treatment)
Jumlah
goal
Impact
Training
program
sebelum sesudah
Ulasan: Solusi; Estimasi Konterfaktual/Kontrafaktual
1. Tantangannya adalah mengidentifikasi kelompok perlakuan dan
pembanding yang adalah: identik secara statistik tanpa adanya program
2. Bagaimana menentukan kelompok pembanding yang valid?
• Karakteristik rata-rata perlakuan dan kelompok pembanding harus
identik jika tidak ada program
• Kelompok perlakuan tidak boleh mempengaruhi kelompok
pembanding
• Kelompok pembanding akan bereaksi terhadap program dengan
cara yang sama seperti kelompok perlakuan
Ulasan: Masalah Dasar Evaluasi; Kerangka Kerja
Potensi Hasil (Potential Outcome Framework)
• Secara spesifik:
E [Yi | Di = 1] − E [Yi | Di = 0] = ATE + Bias
• Istilah pertama di atas adalah efek kausal rata-rata dari perlakuan
(Average Treatment Effects, ATE).
• E [Y1i | Di = 1] adalah hasil rata-rata dari mereka yang menerima
perlakuan
• E [Y0i | Di = 1] hasil kontrafaktual rata-rata seandainya mereka tidak
menerima perlakuan
• E [Y0i | Di = 1] ini bias. Mengapa?
Ulasan: Solusi; Dua Konterfaktual/Kontrafaktual Buatan
• With-and-without comparisons
Jumlah
goal
Impact
Hitam; non-treatment
Biru; treatment
Kontrafaktual: Hitam,
sesudah
Training
sebelum program
sesudah
Ulasan: Solusi; Dua Konterfaktual/Kontrafaktual Buatan
• Before-and-after(pre-and-post)comparisons
Jumlah
goal
Impact
Biru; treatment
Kontrafaktual: Biru,
sebelum
Training
sebelum program
sesudah
Post-Tutorial Assignment
• Melakukan estimasi regresi OLS dengan data yang sudah disediakan
(wage1.dta)
• Regresi gaji (dalam satuan log) dengan lama pengalaman, lama pengalaman
kuadrat, lama tenure, lama tenure kuadrat, pendidikan, warna kulit, interaksi
antara variabel kategorikal gender dan status pernikahan
• Secara lisan, apakah model di atas memenuhi semua asumsi Gauss
Markov? Jika iya/tidak, jelaskan!
Post-Tutorial Assignment
• Document dikumpulkan dalam bentuk do.file dengan format nama
file:
Full Name/S1/S2/S3
• Kumpulkan: anggita.utomo@mail.ugm.ac.id, cc: lab-ie.feb@ugm.ac.id
dengan subject: “Tugas Stata_number session_Name”
• Email: anggita.utomo@mail.ugm.ac.id