Anda di halaman 1dari 60

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/337419996

Catatan dan Pembahasan Soal Ekonometri

Method · December 2019

CITATIONS READS
0 17,180

1 author:

Ratna Indrayanti
Lembaga Demografi
21 PUBLICATIONS   12 CITATIONS   

SEE PROFILE

All content following this page was uploaded by Ratna Indrayanti on 08 June 2020.

The user has requested enhancement of the downloaded file.


1 Catatan dan Pembahasan Soal Ekonometrika
2 Catatan dan Pembahasan Soal Ekonometrika

Daftar Isi

1. Review Asumsi Dasar OLS.................................................................................................................................................3

2. Variabel Dummy dan Difference in Difference ........................................................................................................5

3. Model Regresi Lanjutan: Perubahan Skala dan Perbedaan Group ............................................................... 10

4. Endogenitas ......................................................................................................................................................................... 19

5. Analisis Data Panel............................................................................................................................................................ 25

6. LPM, Logit, dan Probit ..................................................................................................................................................... 45

7. Ordered Logit dan Multinomial Logit ....................................................................................................................... 49


3 Catatan dan Pembahasan Soal Ekonometrika

1. Review Asumsi Dasar OLS

Model regresi linier sederhana dapat dituliskan sebagai berikut:

𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖 ; 𝑖 = 1,2, … … … … … … . . , 𝑁

yang mana: N merupakan banyaknya observasi

Prinsip Ordinary Least Square (OLS)

𝑀𝑖𝑛𝑖𝑚𝑖𝑧𝑒
∑ 𝑢𝑖2 = ∑(𝑌𝑖 − 𝛽1 − 𝛽2 𝑋𝑖 )2
𝛽1 ,𝛽2

Teorema Gauss-Markov

Apabila model regresi linier memenuhi asumsi-asumsi berikut, maka taksiran yang diperoleh dengan

metode Ordinary Least Square mempunyai sifat BLUE (Best Linier Unbiased Estimator):

(i) 𝐸(𝑢𝑖 ) = 0

(ii) 𝑐𝑜𝑣 (𝑢𝑖 , 𝑢𝑗 ) = 0; 𝑖 ≠ 𝑗

(iii) 𝑣𝑎𝑟 (𝑢𝑖 |𝑥𝑖 ) = 𝜎 2 sama untuk setiap i (homoscedasticity)

(iv) 𝑐𝑜𝑣 (𝑢𝑖 , 𝑥𝑖 ) = 0

(v) Model regresi dispesifikasi secara benar

Penjelasan mengenai asumsi-asumsi tersebut adalah sebagai berikut:

(i) 𝐸 (𝑢𝑖 ) = 0 𝑎𝑡𝑎𝑢 𝐸(𝑢𝑖 |𝑥𝑖 ) = 0 𝑎𝑡𝑎𝑢 𝐸(𝑌𝑖 ) = 𝛽1 + 𝛽2 𝑋𝑖

𝑢𝑖 menyatakan variabel-variabel lain yang memengaruhi 𝑌𝑖 akan tetapi tidak terwakili di dalam model

Misal: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖

Yang mana:

𝑌𝑖 = 𝑢𝑝𝑎ℎ

𝑋𝑖 = 𝑝𝑒𝑛𝑑𝑖𝑑𝑖𝑘𝑎𝑛 (𝑙𝑎𝑚𝑎 𝑠𝑒𝑘𝑜𝑙𝑎ℎ)

𝑢𝑖 = 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙 𝑙𝑎𝑖𝑛 𝑠𝑒𝑙𝑎𝑖𝑛 𝑙𝑎𝑚𝑎 𝑠𝑒𝑘𝑜𝑙𝑎ℎ 𝑦𝑎𝑛𝑔 𝑚𝑒𝑚𝑒𝑛𝑔𝑎𝑟𝑢ℎ𝑖 𝑢𝑝𝑎ℎ

Asumsi: pada saat 𝑋𝑖 (𝑙𝑎𝑚𝑎 𝑠𝑒𝑘𝑜𝑙𝑎ℎ) terobservasi, pengaruh 𝑢𝑖 terhadap 𝑌𝑖 diabaikan atau 𝑢𝑖 tidak

memengaruhi 𝐸(𝑌𝑖 ) secara sistematis


4 Catatan dan Pembahasan Soal Ekonometrika

(ii) tidak ada korelasi antara 𝑢𝑖 dan 𝑢𝑗 {𝑐𝑜𝑣 (𝑢𝑖 , 𝑢𝑗 |𝑥𝑖 , 𝑥𝑗 ) = 0}; 𝑖 ≠ 𝑗

Artinya, pada saat 𝑥𝑖 sudah terobservasi, deviasi 𝑌𝑖 dari meannya tidak menunjukkan adanya pola
{𝐸 (𝑢𝑖 , 𝑢𝑗 ) = 0}

(iii). Homocedasticity; variansi 𝑢𝑖 sama; 𝑣𝑎𝑟(𝑢𝑖 ) = 𝜎 2 untuk setiap i

Misalkan:

Y= konsumsi/minggu

X=pendapatan/minggu

Terdapat hubungan yang positif antara X dan Y, dalam arti jika X meningkat, maka Y akan meningkat

pula. Dengan perkataan lain, makin kaya seseorang kian besar konsumsinya, tetapi variansinya juga

makin besar.

Bila:

▪ Variasi konsumsi orang kaya lebih besar dari orang miskin dikatakan heteroscedasticity

▪ Variasi konsumsi orang kaya sama dengan orang miskin dikatakan homocedasticity

(iv). Kovariansi antara 𝑢𝑖 dan 𝑥𝑖 nol {𝑐𝑜𝑣 (𝑢𝑖 , 𝑥𝑖 ) = 0}

Tidak ada korelasi antara 𝑢𝑖 dan 𝑥𝑖 . Dengan perkataan lain, bila 𝑥𝑖 : non-random, maka 𝐸 (𝑥𝑖 , 𝑢𝑖 ) = 0.

Jika 𝑥𝑖 meningkat, maka 𝑢𝑖 akan meningkat pula. Jika 𝑥𝑖 menurun, maka 𝑢𝑖 akan menurun pula. Maka

dikatakan bahwa ada korelasi antara 𝑢𝑖 dan 𝑥𝑖 .

(v). Model regresi dispesifikasi secara benar

Sebelum membuat model, kita perlu memperhatikan hal-hal sebagai berikut:

Bagaimana yang dikatakan oleh teori:

▪ Variabel-variabel apa saja yang perlu diperhatikan

▪ Bagaimana bentuk fungsinya


5 Catatan dan Pembahasan Soal Ekonometrika

2. Variabel Dummy dan Difference in Difference

Persamaan regresi sederhana dan berganda sebelumnya hanya menunjukkan hubungan antara

variabel numerik baik variabel terikat maupun variabel bebasnya. Padahal untuk mengungkapkan

suatu fenomena, tidak jarang dibutuhkan variabel bukan numerik, yang salah satunya adalah variabel

kategorik

Contoh:

▪ Pengaruh wilayah tempat tinggal terhadap upah yang diterima

▪ Pengaruh Lapangan Usaha terhadap upah yang diterima

▪ Pengaruh tingkat pendidikan terhadap lama mencari kerja.

Bagaimana membentuk variabel Dummy?

▪ Variabel Dummy bernilai 1 atau 0

Ilustrasi:

1. Kota

2. Desa

Apakah bisa kita membuat regresi dengan ‘kode kategorik’ diatas, yaitu 1 dan 2?

Bila digunakan kode kategorik tersebut, berarti kita sudah memberi nilai pada ‘Desa’dua

kali‘Kota’.

Bila dibuat dummy, misalnya:

1. Kota = 1

2. Desa = 0.

Model: Y =  +  D + u

Y = Upah

D= Daerah tempat tinggal

D = 1 ; Kota

D = 0 ; Desa

u = kesalahan random.

▪ Dari model tersebut, rata-rata upah tenaga kerja :


6 Catatan dan Pembahasan Soal Ekonometrika

Kota : E (Y  D = 1) =  + 
Desa : E (Y  D = 0) = 
▪ Jika  = 0 → tidak terdapat perbedaan upah antara daerah perkotaan dengan pedesaan.

▪ Jika   0 → terdapat perbedaan upah antara daerah perkotaan dengan pedesaan.

▪ Model diatas → merupakan model Regresi → OLS

Variabel dengan kategori lebih dari 2

Ilustrasi: Lapangan Usaha mempunyai 3 kategori:

1. Pertanian

2. Industri

3. Jasa

 Dibutuhkan variabel dummy sebanyak (3-1) = 2.

 Dua variabel dummy tersebut yaitu D2 dan D3 didefinisikan sebagai berikut:

D2 = 1 ; Lapangan usaha industri

0 ; lainnya

D3= 1 ; Lapangan usaha jasa

0 ; lainnya

Perhatikan model berikut :

Y = 1 + 2 D2 + 3 D3 +  X + u

Y= upah yang diterima tenaga kerja

X=pengalaman

D2 =1 ; lapangan usaha industri

0 ; lainnya

D3=1 ; lapangan usaha jas

0 ; lainnya

Rata-rata upah tenaga kerja berdasarkan lapangan usaha:

 Pertanian : 1 + X

 Industri : 1 + 2 + X

 Jasa : 1 + 3 + X
7 Catatan dan Pembahasan Soal Ekonometrika

Ilustrasi dengan variabel interaksi

Diberikan persamaan upah sebagai berikut:


𝑤𝑎𝑔𝑒
̂ = 5 + 0,8𝑒𝑑𝑢𝑐 − 0,2𝑓𝑒𝑚𝑎𝑙𝑒 + 0,1𝑢𝑟𝑏𝑎𝑛 − 0,3𝑒𝑑𝑢𝑐 ∗ 𝑓𝑒𝑚𝑎𝑙𝑒
Rata-rata upah laki-laki: 𝑤𝑎𝑔𝑒
̂𝑚 = 5 + 0,8 𝑑𝑢𝑐 + 0,1𝑢𝑟𝑏𝑎𝑛

Rata-rata upah perempuan: 𝑤𝑎𝑔𝑒


̂ 𝑓 = (5 − 0,2) + (0,8 − 0,3)𝑒𝑑𝑢𝑐 + 0,1𝑢𝑟𝑏𝑎𝑛

educ*female: menggambarkan dampak perubahan educ (lama sekolah) terhadap upah antara laki-

laki dan perempuan atau menggambarkan rate of return dari pendidikan antara laki-laki dan

perempuan

Contoh soal 2.1

Diberikan suatu model linier yang menjelaskan mengenai perilaku konsumsi seorang individu yang

merupakan fungsi dari pendapatan (inc), pendidikan (educ), jenis kelamin (female) dan lokasi (urban)

yang dinyatakan sebagai berikut:

𝐶̂ = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒 + 𝛽4 𝑢𝑟𝑏𝑎𝑛


Yang mana:

C = konsumsi seseorang dalam juta rupiah

Inc = pendapatan seseorang dalam juta rupiah

Female = jenis kelamin (1=wanita; 0=pria)

Educ = lama pendidikan seseorang dalam tahun

Urban = lokasi tempat tinggal (1=kota; 0=desa)

Berdasarkan persamaan tersebut:

a. Rata-rata konsumsi berdasarkan lokasi tempat tinggal:

Kota (urban=1) : 𝐶̂ = (𝛽0 + 𝛽4 ) + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒

Desa (urban=0) : 𝐶̂ = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒

𝛽4 menunjukkan perbedaan konsumsi antara individu di kota dan di desa, dengan asumsi

cateris paribus. Apabila 𝛽4 > 0, artinya konsumsi individu di kota lebih besar dibandingkan di

desa untuk individu pada tingkat pendapatan sama, jenis kelamin sama, dan lama sekolah

yang sama.
8 Catatan dan Pembahasan Soal Ekonometrika

b. Apabila sekarang variabel dummy lokasi diubah menjadi rural (0=kota; 1=desa) dan variabel

lainnya tetap, maka persamaan regresi baru menjadi:

𝐶̂ = (𝛽0 + 𝛽4 ) + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒 − 𝛽4 𝑟𝑢𝑟𝑎𝑙


c. Apabila persamaan awal ditambahkan variabel interaksi antara pendapatan dan lokasi

(inc*urban), maka persamaan regresi baru menjadi:


𝐶̂ = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒 + 𝛽4 𝑢𝑟𝑏𝑎𝑛 + 𝛽5 𝑖𝑛𝑐 ∗ 𝑢𝑟𝑏𝑎𝑛
Rata-rata konsumsi berdasarkan lokasi tempat tinggal:

Kota (urban=1): 𝐶̂ = (𝛽0 + 𝛽4 ) + (𝛽1 + 𝛽5 )𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒

Desa (urban=0): 𝐶̂ = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒

Pengertian koefisien variabel interaksi inc*urban (𝛽5 ) adalah perbedaan MPC (marginal

propensity to consume) antara individu di kota dan di desa

d. Apabila persamaan awal ditambahkan variabel interaksi antara jenis kelamin dan lokasi

(female*urban), maka persamaan regresi baru menjadi:

𝐶̂ = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽3 𝑓𝑒𝑚𝑎𝑙𝑒 + 𝛽4 𝑢𝑟𝑏𝑎𝑛 + 𝛽5 𝑓𝑒𝑚𝑎𝑙𝑒 ∗ 𝑢𝑟𝑏𝑎𝑛


Perempuan (female=1): 𝐶̂ = (𝛽0 + 𝛽3 ) + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + (𝛽4 + 𝛽5 )𝑢𝑟𝑏𝑎𝑛

Laki-laki (female=0): 𝐶̂ = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑒𝑑𝑢𝑐 + 𝛽4 𝑢𝑟𝑏𝑎𝑛

Pengertian koefisien variabel interaksi female*urban (𝛽5 ) adalah perbedaan konsumsi antara

wanita di kota dengan kategori lainnya yakni wanita di desa, laki-laki di kota, dan laki-laki di

desa, cateris paribus

Contoh Soal 2.2

Marsha Timothy tertarik mempelajari dampak kehadiran supermarket terhadap pedagang ritel

tradisional (warung sembako) di daerah perkotaan di Indonesia. Marsha Timothy memiliki pendapat

bahwa kehadiran supermarket diduga memberikan dampak terhadap keuntungan (profit) warung

sembako. Untuk membuktikan hal itu, Marsha Timothy melakukan pengumpulan data pada 2 titik

waktu yaitu Januari dan Desember 2016 untuk setiap pedagang ritel tradisional (kehadiran

supermarket terjadi pada bulan Juni-Juli 2016). Selanjutnya, Marsha Timothy menyusun model

ekonometrika (empiris) yang dinyatakan sebagai bentuk:


𝑗 𝑗
𝑝𝑟𝑜𝑓𝑖 = 𝛽0 + 𝛽1 𝑃𝑖 + 𝛽2 𝐷 𝑠 + 𝛽3 (𝑃𝑖 𝑥𝐷 𝑠 ) + 𝛽4 𝐷𝑖 + 𝛽5 (𝐷 𝑠 𝑥𝐷𝑖 ) + 𝜀𝑖
Dengan:

𝑝𝑟𝑜𝑓𝑖 adalah keuntungan (profit) warung sembako ke-i


9 Catatan dan Pembahasan Soal Ekonometrika

𝑃𝑖 adalah nilai penjualan untuk warung sembako ke-i

𝐷 𝑠 adalah variable yang bersifat dummy, bernilai 1 untuk observasi yang diambil setelah adanya

supermarket (Desember 2016) dan 0 untuk sebelum adanya supermarket (Januari 2016)

𝐷𝑖 adalah adalah variable yang bersifat dummy, bernilai 1 jika warung sembako berjarak sangat dekat
𝑗

dengan supermarket dan 0 untuk berjarak sangat jauh.

𝑃𝑖 𝑥𝐷 𝑠 adalah variable interaksi antara 𝑃𝑖 dan 𝐷 𝑠 , sementara 𝐷 𝑠 𝑥𝐷𝑖 adalah variable interaksi antara
𝑗

variable 𝐷 𝑠 dengan 𝐷𝑖
𝑗

Berdasarkan informasi di atas, jawablah beberapa pertanyaan berikut:

a. Apabila 𝛽2 <0, jelaskan pengertian dari koefisien variabel dummy 𝐷 𝑠 tersebut? (4 point)

b. Mengukur hal apakah variabel interaksi 𝑃𝑖 𝑥𝐷 𝑠 di dalam model? Dan apabila nilai 𝛽3 < 0

jelaskan pengertiannya? (8 point)

Dengan adanya variable 𝐷 𝑠 𝑥𝐷𝑖 di dalam model, jelaskan maksud digunakannya variable
𝑗
c.

interaksi ini? Dan apabila nilai𝛽5 <0 , jelaskan pengertiannya? (9 point)

Apabila sekarang variabel dummy jarak (𝐷𝑖 ) diubah nilainya menjadi 1=jauh dan 0=dekat
𝑗
d.

serta variabel lainnya tetap, apa yang terjadi dengan nilai koefisien 𝛽 (4 point)

Pembahasan:

a. 𝛽2 menunjukkan perbedaan profit warung sembako antara setelah adanya supermarket dan

sebelum adanya supermarket, dengan asumsi cateris paribus. Apabila 𝛽2 < 0, artinya profit

warung sembako setelah adanya supermarket lebih kecil dibandingkan sebelum adanya

supermarket untuk warung sembako yang memiliki nilai penjualan dan jarak dengan

supermarket yang sama

b. Pengertian koefisien variabel interaksi 𝑃𝑖 𝑥𝐷 𝑠 (𝛽3 ) adalah perbedaan Marginal profit warung

sembako antara sesudah dan sebelum adanya supermarket. Apabila 𝛽3 < 0, artinya marginal

profit warung sembako setelah adanya supermarket lebih kecil dibandingkan sebelum

adanya supermarket untuk warung sembako yang memiliki nilai penjualan dan jarak dengan

supermarket yang sama

c. Kegunaan variable 𝐷 𝑠 𝑥𝐷𝑖 adalah untuk mengetahui perbedaan profit warung sembako
𝑗

setelah dan sebelum adanya supermarket yang lokasinya dekat dan jauh dengan

supermarket. Apabila 𝛽5 < 0, artinya profit warung sembako setelah adanya supermarket
10 Catatan dan Pembahasan Soal Ekonometrika

yang lokasinya dekat dengan supermarket lebih kecil dibandingkan kategori lainnya, yakni

warung sembako setelah adanya supermarket yang lokasinya jauh dengan supermarket,

warung sembako sebelum adanya supermarket yang lokasinya dekat dengan supermarket,

dan warung sembako sebelum adanya supermarket yang lokasinya jauh dengan supermarket

d. Apabila sekarang variabel dummy jarak (𝐷𝑖 ) diubah nilainya menjadi 1=jauh dan 0=dekat
𝑗

serta variabel lainnya tetap, maka persamaan regresi baru menjadi:


𝒋 𝒋
𝒑𝒓𝒐𝒇𝒊 = (𝜷𝟎 + 𝜷𝟒 ) + 𝜷𝟏 𝑷𝒊 + (𝜷𝟐 + 𝜷𝟓 )𝑫𝒔 + 𝜷𝟑 (𝑷𝒊 𝒙𝑫𝒔 ) − 𝜷𝟒 𝑫𝒊 − 𝜷𝟓 (𝑫𝒔 𝒙𝑫𝒊 ) + 𝜺𝒊

3. Model Regresi Lanjutan: Perubahan Skala dan Perbedaan Group

Perubahan Skala

Terkadang kita meregresikan variabel terikat (y) yang memiliki nilai (angka) sangat kecil misal

pertumbuhan ekonomi dalam satuan persen, sedangkan variabel bebas (x)-nya nilai (angkanya)

besar. Misalnya nilai investasi dalam milyar rupiah tidak dibentuk logaritma, sehingga hasil koefisien

regresinya dari x akan kecil, misal 0,000. Hal itu disebabkan per-skalaan yang dibuat kurang baik.

Begitu juga sebaliknya, misal variabel y (terikat)-nya adalah upah dalam satuan rupiah dan variabel x-

nya adalah lama sekolah dan pengalaman dalam satuan tahun, akibatnya koefisien hasil regresinya

akan sangat besar.

Kegunaan melakukan rescaling adalah untuk memberikan kemudahan dalam melakukan interpretasi.

Perubahan skala tidak merubah hasil penelitian dalam aspek apapun, hanya merubah cara membaca

atau menginterpretasikan hasil regresi bukan esensi. Dalam hal ini dampak rescaling terhadap

variabel tergantung (regresor) dan bebas (regresand). Perubahan skala pada masing-masing tipe

variabel membawa implikasi tersendiri dan diperlukan suatu kehati-hatian agar dapat dilakukan

dengan benar.

Misal diberikan persamaan sebagai berikut:


𝒘𝒂𝒈𝒆 = 𝜶𝟎 + 𝜶𝟏 𝒆𝒅𝒖𝒄 + 𝜶𝟐 𝒆𝒙𝒑𝒆𝒓
Yang mana:
𝑤𝑎𝑔𝑒 = 𝑢𝑝𝑎ℎ (𝑑𝑎𝑙𝑎𝑚 𝑟𝑖𝑏𝑢 𝑟𝑢𝑝𝑖𝑎ℎ)
𝑒𝑑𝑢𝑐 = 𝑙𝑎𝑚𝑎 𝑠𝑒𝑘𝑜𝑙𝑎ℎ (𝑑𝑎𝑙𝑎𝑚 𝑡𝑎ℎ𝑢𝑛)
𝑒𝑥𝑝𝑒𝑟 = 𝑝𝑒𝑛𝑔𝑎𝑙𝑎𝑚𝑎𝑛 (𝑑𝑎𝑙𝑎𝑚 𝑡𝑎ℎ𝑢𝑛)
11 Catatan dan Pembahasan Soal Ekonometrika

Jika satuan upah dijadikan dalam juta rupiah, berarti data w dibagi dengan 1000. Lalu apa yang terjadi

dengan 𝛼0 , 𝛼1 , 𝑑𝑎𝑛 𝛼2

Buka data MROZ (rincian langkah pengerjaan dengan menggunakan STATA dapat dilihat pada

Lampiran di bagian akhir)

Pertama, lakukan regresi upah (wage) dengan variabel bebas educ dan exper

reg wage educ exper

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 2, 425) = 29.13
Model | 564.091032 2 282.045516 Prob > F = 0.0000
Residual | 4114.9619 425 9.6822633 R-squared = 0.1206
-------------+------------------------------ Adj R-squared = 0.1164
Total | 4679.05293 427 10.9579694 Root MSE = 3.1116

------------------------------------------------------------------------------
wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .4966344 .0658972 7.54 0.000 .3671094 .6261595
exper | .0247391 .0186943 1.32 0.186 -.0120057 .0614839
_cons | -2.431687 .8854782 -2.75 0.006 -4.172148 -.6912249
------------------------------------------------------------------------------

Kedua, generate variabel upah baru: wage2 yang merupakan wage/1000

gen wage2=wage/1000

Ketiga, lakukan regresi ulang dengan variabel dependent-nya adalah wage2

reg wage2 educ exper

. reg wage2 educ exper

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 2, 425) = 29.13
Model | .000564091 2 .000282046 Prob > F = 0.0000
Residual | .004114962 425 9.6823e-06 R-squared = 0.1206
-------------+------------------------------ Adj R-squared = 0.1164
Total | .004679053 427 .000010958 Root MSE = .00311

------------------------------------------------------------------------------
wage2 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0004966 .0000659 7.54 0.000 .0003671 .0006262
exper | .0000247 .0000187 1.32 0.186 -.000012 .0000615
_cons | -.0024317 .0008855 -2.75 0.006 -.0041721 -.0006912
------------------------------------------------------------------------------
Apa yang terjadi?

𝜶𝟎 𝜶𝟏 𝜶𝟐
̂ 𝟐=
𝒘𝒂𝒈𝒆 + 𝒆𝒅𝒖𝒄 + 𝒆𝒙𝒑𝒆𝒓
𝟏𝟎𝟎𝟎 𝟏𝟎𝟎𝟎 𝟏𝟎𝟎𝟎
12 Catatan dan Pembahasan Soal Ekonometrika

Catatan:

𝒘𝒂𝒈𝒆𝟐 = 𝒘𝒂𝒈𝒆/𝟏𝟎𝟎𝟎 (dalam satuan juta)

Misal: 𝒘𝒂𝒈𝒆𝟑 = 𝒘𝒂𝒈𝒆 ∗ 𝟏𝟎𝟎𝟎 (dalam satuan rupiah)

Sehingga langkah Keempat, generate variabel upah baru: wage3 yang merupakan wage*1000

gen wage3=wage*1000

Kelima, lakukan regresi ulang dengan variabel dependent-nya adalah wage3

reg wage3 educ exper

Source | SS df MS Number of obs = 428


-------------+---------------------------------- F(2, 425) = 29.13
Model | 564091042 2 282045521 Prob > F = 0.0000
Residual | 4.1150e+09 425 9682263.43 R-squared = 0.1206
-------------+---------------------------------- Adj R-squared = 0.1164
Total | 4.6791e+09 427 10957969.6 Root MSE = 3111.6

------------------------------------------------------------------------------
wage3 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | 496.6344 65.89722 7.54 0.000 367.1094 626.1595
exper | 24.7391 18.69431 1.32 0.186 -12.00571 61.48392
_cons | -2431.687 885.4782 -2.75 0.006 -4172.149 -691.2249
------------------------------------------------------------------------------

Apa yang terjadi?


̂ 𝟑 = 𝜶𝟎 ∗ 𝟏𝟎𝟎𝟎 + (𝜶𝟏 ∗ 𝟏𝟎𝟎𝟎) 𝒆𝒅𝒖𝒄 + (𝜶𝟐 ∗ 𝟏𝟎𝟎𝟎) 𝒆𝒙𝒑𝒆𝒓
𝒘𝒂𝒈𝒆

Perubahan Skala pada Variabel Bebas (X)

Persamaan:
𝒘𝒂𝒈𝒆 = 𝜷𝟎 + 𝜷𝟏 𝒆𝒅𝒖𝒄 + 𝜷𝟐 𝒆𝒙𝒑𝒆𝒓
Yang mana:
𝑤𝑎𝑔𝑒 = 𝑢𝑝𝑎ℎ (𝑑𝑎𝑙𝑎𝑚 𝑟𝑖𝑏𝑢 𝑟𝑢𝑝𝑖𝑎ℎ)
𝑒𝑑𝑢𝑐 = 𝑙𝑎𝑚𝑎 𝑠𝑒𝑘𝑜𝑙𝑎ℎ (𝑑𝑎𝑙𝑎𝑚 𝑡𝑎ℎ𝑢𝑛)
𝑒𝑥𝑝𝑒𝑟 = 𝑝𝑒𝑛𝑔𝑎𝑙𝑎𝑚𝑎𝑛 (𝑑𝑎𝑙𝑎𝑚 𝑡𝑎ℎ𝑢𝑛)
Misal variabel educ satuannya dirubah menjadi bulan

𝑒𝑑𝑢𝑐2 = 𝑒𝑑𝑢𝑐 ∗ 12 (satuan bulan)

Pertama, generate variabel pendidikan baru: educ2 yang merupakan educ*12

gen educ2=educ*12
13 Catatan dan Pembahasan Soal Ekonometrika

Kedua, lakukan regresi dengan variabel independent educ2


. reg wage educ2 exper

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 2, 425) = 29.13
Model | 564.091032 2 282.045516 Prob > F = 0.0000
Residual | 4114.9619 425 9.6822633 R-squared = 0.1206
-------------+------------------------------ Adj R-squared = 0.1164
Total | 4679.05293 427 10.9579694 Root MSE = 3.1116

------------------------------------------------------------------------------
wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ2 | .0413862 .0054914 7.54 0.000 .0305924 .05218
exper | .0247391 .0186943 1.32 0.186 -.0120057 .0614839
_cons | -2.431687 .8854782 -2.75 0.006 -4.172148 -.6912249
------------------------------------------------------------------------------

Apa yang terjadi?


𝜷𝟏
𝒘𝒂𝒈𝒆 = 𝜷𝟎 + ( ) 𝒆𝒅𝒖𝒄𝟐 + 𝜷𝟐 𝒆𝒙𝒑𝒆𝒓
𝟏𝟐
Misal 𝒆𝒅𝒖𝒄𝟑 = 𝒆𝒅𝒖𝒄/𝟏𝟐

Maka langka Ketiga, generate variabel pendidikan baru: educ3 yang merupakan educ/12

gen educ3=educ/12

Keempat, lakukan regresi dengan variabel independent educ3


reg wage educ3 exper

Source | SS df MS Number of obs = 428


-------------+---------------------------------- F(2, 425) = 29.13
Model | 564.090999 2 282.045499 Prob > F = 0.0000
Residual | 4114.96193 425 9.68226338 R-squared = 0.1206
-------------+---------------------------------- Adj R-squared = 0.1164
Total | 4679.05293 427 10.9579694 Root MSE = 3.1116

------------------------------------------------------------------------------
wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ3 | 5.959613 .7907667 7.54 0.000 4.405313 7.513914
exper | .0247391 .0186943 1.32 0.186 -.0120057 .0614839
_cons | -2.431687 .8854782 -2.75 0.006 -4.172148 -.6912248
------------------------------------------------------------------------------

Apa yang terjadi?


𝒘𝒂𝒈𝒆 = 𝜷𝟎 + (𝜷𝟏 ∗ 𝟏𝟐)𝒆𝒅𝒖𝒄𝟑 + 𝜷𝟐 𝒆𝒙𝒑𝒆𝒓
14 Catatan dan Pembahasan Soal Ekonometrika

Kesimpulan:

- Jika variabel y dikali atau dibagi 10 maka semua koefisien dari variabel x dikali atau dibagi

dengan 10

- Jika salah satu variabel x dikali atau dibagi 10 maka hanya variabel itu saja yang

koefisiennya dibagi atau dikali 10

Contoh Soal 3.1

Persamaan:
̂0 + 𝛽
𝑏𝑤𝑖𝑔ℎ𝑡 = 𝛽 ̂1 𝑐𝑖𝑔𝑠 + 𝛽
̂2 𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢

Yang mana:

bwight = berat badan bayi baru lahir (gram)

cigs = jumlah rokok yang dikonsumsi ibunya waktu hamil (batang) → 1pak=20 batang

faminc = jumlah penghasilan keluarga

Kasus 3.1. a

Jika semula mengukur berat badan dalam satuan gram dan mengubahnya menjadi satuan kilogram,

maka transformasi persamaannya menjadi:


̂0 /1000) + (𝛽
𝑏𝑤𝑖𝑔ℎ𝑡/1000 = (𝛽 ̂1 /1000)𝑐𝑖𝑔𝑠 + (𝛽
̂2 /1000)𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢

0 1
̂∗ 𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢
𝑏𝑤𝑖𝑔ℎ𝑡 ∗ = 𝛽̂∗ + 𝛽̂∗ 𝑐𝑖𝑔𝑠 + 𝛽 2

Interpretasi awal: ex: 𝛽


̂1 , setiap ada tambahan konsumsi rokok ibu hamil sebesar 1 batang maka

terjadi perubahan berat badan bayi sebesar 𝛽


̂1 gram.

Interpretasi setelah transformasi; ex: 𝛽


̂1 , setiap ada tambahan konsumsi rokok ibu hamil sebesar 1

batang maka terjadi perubahan berat badan bayi sebesar 𝛽


̂1 1/1000 kilogram.

Kasus 3.1. b

Jika rescaling dilakukan hanya pada variabel bebas, maka perubahan koefisien hanya terjadi pada

variabel itu sendiri. Jika semula cigs diukur sebagai batang rokok perhari diubah menjadi per pak per

hari, maka transformasi nya adalah:


̂0 + (20𝛽
𝑏𝑤𝑖𝑔ℎ𝑡 = 𝛽 ̂1 )(𝑐𝑖𝑔𝑠/20) + 𝛽
̂2 𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢
𝑏𝑤𝑖𝑔ℎ𝑡 = 𝛽̂ + 𝛽̂ 𝑐𝑖𝑔𝑠 ∗ + 𝛽
0

1
̂𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢
2

Interpretasi awal: ex: 𝛽


̂1 , setiap ada tambahan konsumsi rokok ibu hamil sebesar 1 batang maka

terjadi perubahan berat badan bayi sebesar 𝛽


̂1 gram.
15 Catatan dan Pembahasan Soal Ekonometrika

Interpretasi setelah transformasi; ex: 𝛽


̂1 , setiap ada tambahan konsumsi rokok ibu hamil sebesar 1

pak maka terjadi perubahan berat badan bayi sebesar 𝛽


̂1 *20 gram

Contoh Soal 3.2

Persamaan:
̂0 + 𝛽
𝑏𝑤𝑖𝑔ℎ𝑡 = 𝛽 ̂1 𝑐𝑖𝑔𝑠 + 𝛽
̂2 𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢

Yang mana:

bwight = berat badan bayi baru lahir (kilogram)

cigs = jumlah rokok yang dikonsumsi ibunya waktu hamil (pak) → 1pak=10 batang

Kasus 3.2. a

Jika semula mengukur berat badan dalam satuan kilogram dan mengubahnya menjadi satuan

gram, maka transformasi persamaannya menjadi:


̂0 ∗ 1000) + (𝛽
𝑏𝑤𝑖𝑔ℎ𝑡 ∗ 1000 = (𝛽 ̂1 ∗ 1000)𝑐𝑖𝑔𝑠 + (𝛽
̂2 ∗ 1000)𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢

𝑏𝑤𝑖𝑔ℎ𝑡 ∗ = 𝛽̂∗ ̂∗ ̂∗
0 + 𝛽1 𝑐𝑖𝑔𝑠 + 𝛽2 𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢

Interpretasi awal: ex: 𝛽


̂1 , setiap ada tambahan konsumsi rokok ibu hamil sebesar 1 pak maka terjadi

perubahan berat badan bayi sebesar 𝛽


̂1 kilogram.

Interpretasi setelah transformasi; ex: 𝛽


̂1 , setiap ada tambahan konsumsi rokok ibu hamil sebesar 1 pak

maka terjadi perubahan berat badan bayi sebesar 𝛽


̂1 *1000 gram

Kasus 3.2. b

Jika rescaling dilakukan hanya pada variabel bebas, maka perubahan koefisien hanya terjadi pada

variabel itu sendiri. Jika semula cigs diukur sebagai pak rokok perhari diubah menjadi per batang

per hari, maka transformasi nya adalah:


̂0 ) + (𝛽
𝑏𝑤𝑖𝑔ℎ𝑡 = (𝛽 ̂1 ∗ 1/10)𝑐𝑖𝑔𝑠 ∗ 10 + (𝛽
̂2 )𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢
̂0 + 𝛽̂
𝑏𝑤𝑖𝑔ℎ𝑡 = 𝛽 ∗ ∗ ̂
1 𝑐𝑖𝑔𝑠 + 𝛽2 𝑓𝑎𝑚𝑖𝑛𝑐 + 𝑢

Interpretasi awal: ex: 𝛽


̂1 , setiap ada tambahan konsumsi rokok ibu hamil sebesar 1 pak maka terjadi

perubahan berat badan bayi sebesar 𝛽


̂1 kilogram.

Interpretasi setelah transformasi; ex: 𝛽


̂1 , setiap kenaikan konsumsi rokok sebesar 1 batang maka

terjadi perubahan berat badan bayi sebesar 𝛽


̂1 *1/10 kilogram

-
16 Catatan dan Pembahasan Soal Ekonometrika

Perbedaan Group

Misalkan kita melakukan analisis regresi yang melibatkan beberapa sub sampel, ingin mengetahui

performance mahasiswa laki-laki atau mahasiswa perempuan. Pertanyaannya, kalau kita ingin

membedakan performance laki-laki dan perempuan, kita menggunakan variabel apa? Jawabnya

adalah Dummy jenis kelamin laki-laki dan perempuan

Misalnya ada data sebanyak 1000 observasi yang terdiri dari Laki-laki: 600 dan Perempuan:400

N=1000

L: 600

P:400

Persamaan:
𝐼𝑃𝐾 = 𝛼0 + 𝛼1 𝑇𝑃𝐴 + 𝛼2 𝐿𝑎𝑚𝑎 𝐵𝑒𝑙𝑎𝑗𝑎𝑟
Jika kita ingin menguji perbedaan antara laki-laki dan perempuan, maka bentuk persamaannya

menjadi:
𝐼𝑃𝐾 = 𝛼0 + 𝛼1 𝑇𝑃𝐴 + 𝛼2 𝐿𝐵 + 𝛼3 𝐽𝐾
Jika ingin menguji perbedaan efek Lama Belajar (LB) terhadap IPK antara laki-laki dan perempuan,

maka bentuk persamaannya menjadi:


𝐼𝑃𝐾 = 𝛼0 + 𝛼1 𝑇𝑃𝐴 + 𝛼2 𝐿𝐵 + 𝛼3 𝐽𝐾 + 𝛼4 𝐿𝐵 ∗ 𝐽𝐾
Jika kita ingin mempelajari variabel-variabel penjelas berbeda antara laki-laki dan perempuan, maka

semua variabel bebas diinteraksikan dengan jenis kelamin

Contoh persamaan lain, lihat penjelasan di buku Wooldridge halaman 245

Persamaan:
𝑐𝑢𝑚𝑔𝑝𝑎 = 𝛼0 + 𝛼1 𝑠𝑎𝑡 + 𝛼2 ℎ𝑠𝑝𝑒𝑟𝑐 + 𝛼3 𝑡𝑜𝑡ℎ𝑟𝑠 + 𝑢
Yang mana:

cumgpa : commulative gpa (IPK)

sat : SAT score (skor TPA)

hsperc : high school rank percentile (persentil ranking SMA)

tothrs : total hours of college course (lama belajar)

Jika kita ingin setidaknya ada satu koefisien yang berbeda, antara laki-laki dan perempuan, kita dapat

menggunakan uji F
17 Catatan dan Pembahasan Soal Ekonometrika

𝑐𝑢𝑚𝑔𝑝𝑎 = 𝛼0 + 𝛼1 𝑠𝑎𝑡 + 𝛼2 ℎ𝑠𝑝𝑒𝑐 + 𝛼3 𝑡𝑜𝑡ℎ𝑟𝑠 + 𝛼4 𝑓𝑒𝑚𝑎𝑙𝑒 + 𝛼5 𝑠𝑎𝑡 ∗ 𝑓𝑒𝑚𝑎𝑙𝑒 + 𝛼6 ℎ𝑠𝑝𝑒𝑟𝑐 ∗ 𝑓𝑒𝑚𝑎𝑙𝑒


+ 𝛼7 𝑡𝑜𝑡ℎ𝑟𝑠 ∗ 𝑓𝑒𝑚𝑎𝑙𝑒 + 𝑢
H0: 𝛼4 = 0; 𝛼5 = 0; 𝛼6 = 0; 𝛼7 = 0

Ini menggambarkan apa? Tidak ada perbedaan intersep antara laki-laki dan perempuan

Apa konsekuensinya jika kita menerima Ho? Maka tidak ada perbedaan dari variabel-variabel tadi,

tidak ada perbedaan intersep antara laki-laki dan perempuan.

Buka Data GPA3

Pertama, Lakukan regresi dengan variabel dependent: cumgpa, dan variabel independent: sat,

hsperc, dan tothrs


. reg cumgpa sat hsperc tothrs // persamaan 2.1 seluruh observasi

Source | SS df MS Number of obs = 732


-------------+---------------------------------- F(3, 728) = 74.72
Model | 168.533658 3 56.1778861 Prob > F = 0.0000
Residual | 547.364897 728 .751874858 R-squared = 0.2354
-------------+---------------------------------- Adj R-squared = 0.2323
Total | 715.898555 731 .979341389 Root MSE = .86711

------------------------------------------------------------------------------
cumgpa | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
sat | .0009028 .0002079 4.34 0.000 .0004947 .0013109
hsperc | -.0063791 .0015678 -4.07 0.000 -.0094572 -.0033011
tothrs | .0119779 .0009314 12.86 0.000 .0101494 .0138064
_cons | .9291105 .2285515 4.07 0.000 .4804118 1.377809
------------------------------------------------------------------------------

Kedua, Lakukan regresi dengan variabel dependent: cumgpa, dan variabel independent: sat,

hsperc, dan tothrs namun hanya untuk perempuan


18 Catatan dan Pembahasan Soal Ekonometrika

. reg cumgpa sat hsperc tothrs if female==1 // persamaan 2.2 regresi untuk perempuan
saja

Source | SS df MS Number of obs = 180


-------------+---------------------------------- F(3, 176) = 34.08
Model | 83.4816253 3 27.8272084 Prob > F = 0.0000
Residual | 143.689727 176 .816418902 R-squared = 0.3675
-------------+---------------------------------- Adj R-squared = 0.3567
Total | 227.171352 179 1.2691137 Root MSE = .90356

------------------------------------------------------------------------------
cumgpa | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
sat | .0017281 .0004642 3.72 0.000 .0008119 .0026442
hsperc | -.0059167 .0038895 -1.52 0.130 -.0135927 .0017594
tothrs | .0158603 .0018485 8.58 0.000 .0122122 .0195085
_cons | .1003465 .4810947 0.21 0.835 -.8491105 1.049803
------------------------------------------------------------------------------

Ketiga, Lakukan regresi dengan variabel dependent: cumgpa, dan variabel independent: sat,

hsperc, dan tothrs namun hanya untuk laki-laki

. reg cumgpa sat hsperc tothrs if female==0 // persamaan 2.3 regresi untuk laki-laki
saja

Source | SS df MS Number of obs = 552


-------------+---------------------------------- F(3, 548) = 41.94
Model | 89.6937042 3 29.8979014 Prob > F = 0.0000
Residual | 390.619421 548 .712809162 R-squared = 0.1867
-------------+---------------------------------- Adj R-squared = 0.1823
Total | 480.313125 551 .871711661 Root MSE = .84428

------------------------------------------------------------------------------
cumgpa | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
sat | .0006113 .000231 2.65 0.008 .0001576 .001065
hsperc | -.0059675 .0017459 -3.42 0.001 -.0093969 -.002538
tothrs | .0103004 .001074 9.59 0.000 .0081907 .0124101
_cons | 1.213984 .2602697 4.66 0.000 .7027359 1.725233
------------------------------------------------------------------------------

Kemudian, hitung Fstat dengan rumus sebagai berikut:


[𝑆𝑆𝑅𝑃 − (𝑆𝑆𝑅1 + 𝑆𝑆𝑅2 )] [𝑛 − 2(𝑘 + 1)]
𝐹= 𝑥
𝑆𝑆𝑅1 + 𝑆𝑆𝑅2 𝑘+1
Berdasarkan output regresi di atas maka Fstat dapat kita hitung sebagai berikut:
[547.364897 − (143.689727 + 390.619421 )] [732 − 2(3 + 1)]
𝐹= 𝑥
143.689727 + 390.619421 3+1
19 Catatan dan Pembahasan Soal Ekonometrika

𝑭 = 𝟒, 𝟑𝟕
𝑭𝒕𝒂𝒃𝒆𝒍 𝜶 = 𝟓%, (4,724) =2,37

Karena 𝑭𝒉𝒊𝒕𝒖𝒏𝒈 > 𝑭𝒕𝒂𝒃𝒆𝒍 maka tolak H0

Artinya setidaknya ada satu 𝛽𝑖𝑚 ≠ 𝛽𝑖


𝑓

Review: Persamaan

𝒄𝒖𝒎𝒈𝒑𝒂 = 𝜷𝟎 + 𝜷𝟏 𝒔𝒂𝒕 + 𝜷𝟐 𝒉𝒔𝒑𝒆𝒄 + 𝜷𝟑 𝒕𝒐𝒕𝒉𝒓𝒔


N=semua male dan female

Female: 𝒄𝒖𝒎𝒈𝒑𝒂 = 𝜷𝟎 + 𝜷𝟏 𝒔𝒂𝒕 + 𝜷𝟐 𝒉𝒔𝒑𝒆𝒄 + 𝜷𝟑 𝒕𝒐𝒕𝒉𝒓𝒔


𝒇 𝒇 𝒇 𝒇

Male: 𝒄𝒖𝒎𝒈𝒑𝒂 = 𝜷𝒎 𝒎 𝒎 𝒎
𝟎 + 𝜷𝟏 𝒔𝒂𝒕 + 𝜷𝟐 𝒉𝒔𝒑𝒆𝒄 + 𝜷𝟑 𝒕𝒐𝒕𝒉𝒓𝒔

H0: 𝜷𝟎 = 𝜷𝒎
𝟎 ; 𝜷𝟏 = 𝜷𝟏 ; 𝜷𝟐 = 𝜷𝟐 ; 𝜷𝟑 = 𝜷𝟑
𝒇 𝒇 𝒎 𝒇 𝒎 𝒎𝒇

H1: setidaknya ada satu 𝜷𝒊 = 𝜷𝒎


𝒇
𝒊

Karena 𝑭𝒉𝒊𝒕𝒖𝒏𝒈 > 𝑭𝒕𝒂𝒃𝒆𝒍 maka tolak H0

Untuk data cross section Rsquare 0,3 ataupun 0,4 sudah tinggi.

4. Endogenitas

𝑦 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝑢

𝛽̂𝑖 OLS is BLUE

𝐸 = (𝑋1 , 𝑢) = 0

𝐸 = (𝑋2 , 𝑢) = 0

Misalkan ada persamaan upah sebagai berikut:

𝑤𝑎𝑔𝑒 = 𝛼0 + 𝛼1 𝑒𝑑𝑢𝑐 + 𝛼2 𝑠𝑘𝑖𝑙𝑙 + 𝑢


Karena skill tidak ada datanya sehingga persamaannya menjadi:

𝒘𝒂𝒈𝒆 = 𝜶𝟎 + 𝜶𝟏 𝒆𝒅𝒖𝒄 + 𝒖
Jika diyakini bahwa:
𝐸 = (𝐸𝑑𝑢𝑐, 𝑠𝑘𝑖𝑙𝑙) ≠ 0

Maka:

𝐸 = (𝐸𝑑𝑢𝑐, 𝑢) ≠ 0

Sehingga estimasinya harus diatasi dengan Instrumental Variabel (IV)


20 Catatan dan Pembahasan Soal Ekonometrika

Gunakan Data MROZ

Pertama, lakukan regresi upah (lwage) dengan variabel educ

. reg lwage educ

Source | SS df MS Number of obs = 428


-------------+---------------------------------- F(1, 426) = 56.93
Model | 26.3264193 1 26.3264193 Prob > F = 0.0000
Residual | 197.001022 426 .462443713 R-squared = 0.1179
-------------+---------------------------------- Adj R-squared = 0.1158
Total | 223.327441 427 .523015084 Root MSE = .68003

------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .1086487 .0143998 7.55 0.000 .0803451 .1369523
_cons | -.1851968 .1852259 -1.00 0.318 -.5492673 .1788736
------------------------------------------------------------------------------

Berdasarkan output regresi di atas, koefisien educ=0.108. Artinya rate of return educ=10,8%

Jika kita meyakini bahwa:


𝐸 = (𝐸𝑑𝑢𝑐, 𝑢) ≠ 0

Maka estimasi di atas adalah bias, sehingga metode IV perlu diterapkan. Di dalam bukunya
Wooldridge disebutkan bahwa yang menentukan variabel pendidikan adalah pendidikan orang tua.
Sehingga dalam hal ini digunakan pendidikan ayah (fatheduc sebagai instrumental variabel).
Sehingga bentuk regresinya adalah sebagai berikut:

. ivregress 2sls lwage (educ= fatheduc)


Instrumental variables (2SLS) regression Number of obs = 428
Wald chi2(1) = 2.85
Prob > chi2 = 0.0914
R-squared = 0.0934
Root MSE = .68778

------------------------------------------------------------------------------
lwage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0591735 .0350596 1.69 0.091 -.009542 .127889
_cons | .4411034 .4450583 0.99 0.322 -.4311947 1.313402
------------------------------------------------------------------------------
Instrumented: educ
Instruments: fatheduc

Berdasarkan output regresi di atas, koefisien educ=0.591735. Artinya rate of return educ=6%. Hasil
estmasi di atas sudah tidak bisa, karena sudah mengatasi endogenitas.
21 Catatan dan Pembahasan Soal Ekonometrika

Langkah-langkah:

OLS1: reg educ fatheduc (pastikan fatheduc signifikan)

OLS2: reg lwage 𝑒𝑑𝑢𝑐


̂ → predict y_hat

2SLS

Pada dasarnya orang tidak hanya meregresi satu variabel saja, namun tiga atau sampai empat
variabel

𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝑝 + 𝛽3 𝑞 + 𝛽4 𝑟 + 𝑢

Variabel utama=x

Kontrol variabel=p, q, r

Lihat di litetratur apakah variabel utama ada endogenitas, jika iya maka kita harus perbaiki

Pengujian Endogenitas

𝑦 = 𝑓(𝑦1 , 𝑝, 𝑞, 𝑟, 𝑠)

𝑦1 mau ditest apakah 𝑦1 bersifat endogen?

Step 1: 𝑦1 = 𝛼0 + 𝛼1 𝑝 + 𝛼2 𝑞 + 𝛼3 𝑟 + 𝛼4 𝑠 + 𝛼5 𝑧 + 𝑢 → diregress dengan semua variabel bebas.

𝑧 𝑚𝑒𝑟𝑢𝑝𝑎𝑘𝑎𝑛 𝐼𝑉 𝑏𝑎𝑔𝑖 𝑦1

Step 2: ambil residual dari 1 → 𝑢̂

Step 3: 𝑦 = 𝛽0 + 𝛽1 𝑦1 + 𝛽2 𝑝 + 𝛽3 𝑞 + 𝛽4 𝑟 + 𝛽5 𝑟 + 𝛽6 𝑢̂ + 𝑣

Step: uji jika 𝛽6 signifikan maka 𝑦1 bersifat endogen

Jika 𝑦1 bersifat endogen → ivregress 2SLS y (𝑦1 = 𝑧) p q r s

Andaikan tidak signifikan (𝑦1 tidak endogen) → reg 𝑦 𝑦1 𝑝 𝑞 𝑟 𝑠

Contoh ada dua IV


22 Catatan dan Pembahasan Soal Ekonometrika

. reg educ exper expersq fatheduc motheduc

Source | SS df MS Number of obs = 753


-------------+---------------------------------- F(4, 748) = 66.52
Model | 1025.94324 4 256.48581 Prob > F = 0.0000
Residual | 2884.0966 748 3.85574412 R-squared = 0.2624
-------------+---------------------------------- Adj R-squared = 0.2584
Total | 3910.03984 752 5.19952106 Root MSE = 1.9636

------------------------------------------------------------------------------
educ | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
exper | .085378 .0255485 3.34 0.001 .0352228 .1355333
expersq | -.0018564 .0008276 -2.24 0.025 -.0034812 -.0002317
fatheduc | .1845745 .0244979 7.53 0.000 .1364817 .2326674
motheduc | .1856173 .0259869 7.14 0.000 .1346014 .2366331
_cons | 8.366716 .2667111 31.37 0.000 7.843125 8.890307
------------------------------------------------------------------------------

Diduga educ bersifat endogen. IV=fatheduc, motheduc

Karena P value fatheduc, motheduc < 𝛼 = 5%, maka dinilai cocok sebagai IV

predict w2, resid

. reg lwage educ exper expersq w2

Source | SS df MS Number of obs = 428


-------------+---------------------------------- F(4, 423) = 20.53
Model | 36.306365 4 9.07659124 Prob > F = 0.0000
Residual | 187.021076 423 .442130203 R-squared = 0.1626
-------------+---------------------------------- Adj R-squared = 0.1547
Total | 223.327441 427 .523015084 Root MSE = .66493

------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0639033 .0292123 2.19 0.029 .0064841 .1213226
exper | .0463071 .0134368 3.45 0.001 .0198959 .0727183
expersq | -.0009444 .0004001 -2.36 0.019 -.0017308 -.000158
w2 | .0558771 .032788 1.70 0.089 -.0085706 .1203248
_cons | -.011404 .3592486 -0.03 0.975 -.7175388 .6947307
------------------------------------------------------------------------------
Karena P value w2 < 𝛼 = 5%, maka educ endogen
23 Catatan dan Pembahasan Soal Ekonometrika

. ivregress 2sls lwage (educ= fatheduc motheduc) exper expersq

Instrumental variables (2SLS) regression Number of obs = 428


Wald chi2(3) = 24.65
Prob > chi2 = 0.0000
R-squared = 0.1357
Root MSE = .67155

------------------------------------------------------------------------------
lwage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0613966 .0312895 1.96 0.050 .0000704 .1227228
exper | .0441704 .0133696 3.30 0.001 .0179665 .0703742
expersq | -.000899 .0003998 -2.25 0.025 -.0016826 -.0001154
_cons | .0481003 .398453 0.12 0.904 -.7328532 .8290538
------------------------------------------------------------------------------
Instrumented: educ

Instruments: exper expersq fatheduc motheduc

OLS rate of return=11%; dengan 2sls: rate of return=6,1%. Dalam hal ini koefisien educ sudah tidak bias

Sehingga apa yang dimaksud dengan Instrumental Variable (IV)?

Metode OLS tidak dapat digunakan untuk mengestimasi sebuah persamaan tunggal yang
merupakan bagian pembentuk sistem jika satu atau lebih variabel penjelasnya berkorelasi dengan
error.

Sebuah teknik yang digunakan guna mengatasi permasalahan endogenitas yang disebabkan karena:

1. Omitted variable, yang terjadi jika kita tidak memasukkan suatu variabel ke dalam model (dan
seharusnya dia ada) akibatnya ketika y dan x bervariasi maka untuk u juga bervariasi pada
arah yang dapat diduga.
2. Simultaneity, yang terjadi akibat adanya variabel penjelas yang seharusnya bersama dengan
variabel tergantung nilainya ditentukan melalui suatu sistem. Hal ini terjadi ketika regressor
dan salah satu/beberapa regresan dipengaruhi oleh satu/lebih variabel yang tidak ada pada
model regresi (di luar model)

Ilustrasi Penggunaan IV

Misalnya kita akan mengestimasi hubungan antara upah yang diperoleh (log (wage)) dengan
pendidikan (educ) dan variabel kapasitas kerja (abil) sebagai berikut:

log(𝑤𝑎𝑔𝑒)=𝛽0+𝛽1𝑒𝑑𝑢𝑐+𝛽2𝑎𝑏𝑖𝑙+𝑒 …(IVa)

Selanjutnya asumsikan kita tidak dapat memperoleh proxy yang baik untuk abil, sehingga diputuskan
untuk menggabungkannya dengan error term, atau

log(𝑤𝑎𝑔𝑒)=𝛽0+𝛽1𝑒𝑑𝑢𝑐+𝑢 …………(IVb)
24 Catatan dan Pembahasan Soal Ekonometrika

Jika educ dan abil tidak berhubungan maka estimator OLS yang diperoleh adalah tidak bias.
Sebaliknya jika kedua variabel ini berhubungan, maka tidak memasukkan secara eksplisit variabel abil
akan menyebabkan estimator yang diperoleh bersifat bias.

Kita dapat tetap menggunakan persamaan IVb dengan menggunakan suatu instrumental variabel
terhadap educ. Suatu instrumental variabel adalah suatu variabel lain, sebut saja sebagai z, dimana ia
memenuhi asumsi:

1. z adalah tidak berkorelasi terhadap u


Cov (z,u)=0
2. z adalah berkorelasi dengan x (dalam contoh ini berarti educ)
Cov (z,x) ≠ 0

Dalam hal ini IV bukan proxy variabel terhadap abil. Sebaliknya ia justru tidak berkorelasi dengan abil,
karena abil sekarang telah digabungkan dengan error term (u). Dengan demikian proxy yang baik
untuk abil justru bukan kandidat IV yang baik. Beberapa kandidat IV yang dapat dipertimbangan pada
contoh ini misalnya pendidikan ayah/ibu. Variabel tersebut memiliki korelasi dengan educ namun
tidak/kurang berkorelasi dengan u. Wooldridge (2005) menyarankan agar dalam pemilihan IV agar
dilakukan berdasarkan auxiliary regression antara variabel bebas ( educ) dengan kandidat IV. IV
terpilih dilakukan berdasarkan tingkat signifikansi dan model fit tertinggi.

Seorang mahasiswa akan menguji apakah variabel educ adalah bersifat endogen dengan
menggunakan variabel exper, exper2, motheduc dan fatheduc sebagai IV. Regresi IV telah ia lakukan
dan telah menyimpan residual dari regresi ini sebagai variabel w2. Persamaan struktural yang ingin
diestimasi adalah regresi atas log(wage) terhadap educ, exper dan exper2. Hasil yang diperoleh
dengan memasukkan variabel w2 pada persamaan struktural adalah:
25 Catatan dan Pembahasan Soal Ekonometrika

. reg lwage educ exper expersq w2

Source | SS df MS Number of obs = 428


-------------+---------------------------------- F(4, 423) = 20.53
Model | 36.306365 4 9.07659124 Prob > F = 0.0000
Residual | 187.021076 423 .442130203 R-squared = 0.1626
-------------+---------------------------------- Adj R-squared = 0.1547
Total | 223.327441 427 .523015084 Root MSE = .66493

------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0639033 .0292123 2.19 0.029 .0064841 .1213226
exper | .0463071 .0134368 3.45 0.001 .0198959 .0727183
expersq | -.0009444 .0004001 -2.36 0.019 -.0017308 -.000158
w2 | .0558771 .032788 1.70 0.089 -.0085706 .1203248
_cons | -.011404 .3592486 -0.03 0.975 -.7175388 .6947307
------------------------------------------------------------------------------

Variabel w2 pada persamaan struktural di atas signifikan pada tingkat kesalahan 10%, artinya bahwa
variabel educ merupakan variabel endogen, yakni variabel tak bebas yang nilainya ditentukan dalam
sistem persamaan, yakni ditentukan oleh pendidikan ayah ( fatheduc) dan pendidikan ibu (motheduc).

5. Analisis Data Panel

Jenis data yang seperti apa sehingga kita mempertimbangkan menggunakan model panel data?

Jenis data yang observasinya terdiri dari sejumlah sampel individu atau unit (i) pada beberapa periode

(t). sampel unit yang digunakan misalnya rumah tangga, perusahaan, kabupaten, provinsi, negara,

dan sebagainya (dimana i = 1, 2, 3, ..., N). Periode waktu dapat berupa data dengan frekuensi yang

berbentuk harian, mingguan, bulanan, kuartalan, maupun tahunan (dimana t = 1, 2, 3, ..., T). Sebagai

ilustrasi dari bentuk data yang digunakan dalam model panel data adalah sebagai berikut:

Bulan Provinsi Jumlah Jumlah Turis Pengeluaran

Korban Asing yang Kesehatan/PDRB

Covid19 yang Datang/Penduduk (%)

Meninggal (%)

(orang)

Januari DKI Jakarta

Februari DKI Jakarta

Maret DKI Jakarta

April DKI Jakarta


26 Catatan dan Pembahasan Soal Ekonometrika

Bulan Provinsi Jumlah Jumlah Turis Pengeluaran

Korban Asing yang Kesehatan/PDRB

Covid19 yang Datang/Penduduk (%)

Meninggal (%)

(orang)

Mei DKI Jakarta

Januari Jawa Barat

Februari Jawa Barat

Maret Jawa Barat

April Jawa Barat

Mei Jawa Barat

Januari Jawa Tengah

Februari Jawa Tengah

Maret Jawa Tengah

April Jawa Tengah

Mei Jawa Tengah

Dst

Keterangan: peneliti ingin mengetahui pengaruh jumlah turis asing dan pengeluaran

kesehatan (termasuk untuk rapid test) terhadap jumlah korban Covid19 yang meninggal di

34 provinsi dalam kurun waktu bulan Januari-Mei 2020

Sebutkan 2 teknik yang dapat digunakan untuk mengestimasi persamaan data panel yang memiliki

unobserved fixed effect. Selain itu, sebutkan pengujian yang dapat dipakai untuk memilih salah satu
teknik estimasi yang telah anda sebutkan?

dua teknik yang dapat digunakan untuk mengestimasi persamaan data panel yang memiliki

unobserved fixed effect: yakni Fixed effect dan Random effect.


27 Catatan dan Pembahasan Soal Ekonometrika

Error Component Model

𝜆𝑖 (unobserved fixed effect) merupakan fokus dari prosedur estimasi persamaan data panel.

Unobserved, yaitu sesuatu yang tidak terobservasi antar provinsi, kita taruh semua di dalam 𝜆𝑖 .

Misalnya dalam kasus di atas adalah perilaku masyarakat dalam menerapkan protokol kesehatan atau

keseriusan pemimpinnya dalam menangani pandemic Covid19. Sehingga perilaku penduduk dan

pemimpin yang tidak termodelkan tadi kita taruh di dalam 𝜆𝑖 .

Teknik analisis Fixed effect maupun Random effect sudah menerima fakta bahwa adanya unobserved.

Perbedaannya adalah Fixed effect: 𝜆𝑖 diasumsikan berkorelasi dengan variabel independen lainnya

sehingga harus dihilangkan. Jika ternyata 𝜆𝑖 tidak berkorelasi dengan 𝑥𝑖𝑡 maka proses transformasi

untuk menghilangkan 𝜆𝑖 akan menghasilkan estimator yang tidak efisien. Random effect merupakan

pilihan metode yang dapat digunakan dengan kondisi dimana 𝜆𝑖 tidak berkorelasi dengan 𝑥𝑖𝑡 .

FE: 𝐸(𝑋𝑖𝑡 , 𝜆𝑖 ) ≠ 0

RE: 𝐸(𝑋𝑖𝑡 , 𝜆𝑖 ) = 0

Pengujian yang dapat dipakai untuk memilih salah satu teknik analisis menggunakan FE atau RE

adalah dengan Hausman Test, dengan ketentuan: H0: (𝑋𝑖𝑡 , 𝜆𝑖 )= 0 (Random effect) untuk model one

way. Sehingga jika berdasarkan Hausman Test Prob<5% maka tolak H0 atau model yang cocok

digunakan adalah FE.


28 Catatan dan Pembahasan Soal Ekonometrika

Atau berdasarkan H0 dilakukan test:

ˆ −1 ( RE −  FE ) ~  2 (k )
W = ( RE −  FE )' 
Jika W significant, kita seharusnya tidak menggunakan estimator random effects.

Ada 2 teknik atau pendekatan untuk mengestimasi persamaan data panel, yaitu Fixed Effect dan

LSDV. Dapatkah anda menjelaskan persamaan dan perbedaannya?

Persamaan: Fixed Effect dan LSDV adalah 𝜆𝑖 diasumsikan berkorelasi dengan variabel independen

lainnya sehingga harus dihilangkan. Jika ternyata 𝜆𝑖 tidak berkorelasi dengan 𝑥𝑖𝑡 maka proses

transformasi untuk menghilangkan 𝜆𝑖 akan menghasilkan estimator yang tidak efisien.

Perbedaan:

Bentuk persaman Fixed Effect: 𝑦𝑖𝑡 = 𝛽1 𝑥𝑖𝑡 + 𝜆𝑖 + 𝑢𝑖𝑡 dimana t=1,2,...,T

Bentuk persaman LSDV: 𝑦𝑖𝑡 = 𝑎0 + 𝑎1 𝑑2 + 𝑎2 𝑑3 + ⋯ + 𝑎𝑖 𝑑𝑖 + 𝛽1 𝑥𝑖𝑡 + 𝑢𝑖𝑡

Pendekatan LSDV menggunakan regresi dummy. Masalah muncul ketika data panel memiliki cross

section yang besar sehingga semakin banyak dummy yang menyebabkan estimasi menjadi sulit. R-
square dari LSDV cenderung lebih besar karena banyaknya dummy yg menjadi variabel penjelas.

Meskipun pendekatan berbeda tetapi kedua pendekatan akan menghasilkan hasil estimasi yang

sama, termasuk besaran koefisien dan standard error

Apa yang anda ketahui dengan model Panel Data Statis dan Dinamis? Berikan penjelasan anda,

misalnya dalam hal perbedaan dalam persamaan, metode estimasi dan hal lainnya yang Anda

ketahui?

Panel data statis hanya memodelkan dari current variable, sedangkan panel data dinamis tidak hanya

current variable namun juga lag variable. Pada analisa makroekonomi umum ditemui bahwa struktur

data panel memiliki lebih banyak periode dibandingkan dengan cross section-nya. Pada analisa

makroekonomi juga sangatlah umum digunakan bentuk model dengan memasukkan lag dependent

variable sebagai salah satu peubah penjelasnya.

Persamaan Panel Data Statis: 𝑦𝑖𝑡 = 𝛽0 + 𝛽1 𝑥1𝑖𝑡 + 𝛽2 𝑥2𝑖𝑡 + ⋯ + 𝛽𝑘 𝑥𝑘𝑖𝑡 + 𝜀𝑖𝑡


𝜀𝑖𝑡 = 𝜆𝑖 + 𝑢𝑖𝑡

Persamaan Panel Data Dinamis: 𝑦𝑖𝑡 = 𝛾𝑦𝑖,𝑡−1 + 𝛽 ′ 𝑥𝑖𝑡 + 𝛼𝑖∗ +𝜆𝑡 + 𝜀𝑖𝑡
29 Catatan dan Pembahasan Soal Ekonometrika

Pada Persamaan Panel Data Dinamis selain 𝑥𝑖𝑡 yang standar ada unobserved fixed effect, ada

unobserved time effect, ada lag dari dependent variabel. Ketika ada lag dependent variabel muncul

di sisi kanan, otomatis itu strict exogeneity tidak lagi terpenuhi karena ada lag dari dependent

variabel. Sehingga penerapan Least Square Dummy Variable, tidak lagi memberikan hasil yang

konsisten, jadi bias dan kita harus mencari alternative pilihan model lain yang harus kita gunakan

sebagai metode estimasinya.

Metode estimasi pada Panel Data Statis: First differencing, Fixed effect, Random effect. Pada

umumnya peneliti akan menggunakan FE dan RE. Kalau pendekatannya substansial peneliti akan

cenderung menggunakan fixed effect, yakni 𝜆𝑖 diasumsikan berkorelasi dengan variabel independen

lainnya sehingga harus dihilangkan. Jika ragu, maka melakukan hausman test untuk memilih FE atau

RE model.

Metode estimasi pada Panel Data Dinamis

Menurut Hurlin (2010) ada beberapa pilihan metode yang bisa digunakan:

- Maximum Likelihood (ML) atau Full Information Maximum Likelihood (FIML) dengan

beberapa restriksi

- FGLS (dengan beberapa restriksi)

- LSDV bias corrected (Kiviet, 1995)

Namun biasanya peneliti menggunakan metode IV dan GMM untuk analisis panel data dinamis.

- IV (Anderson and Hsiao, 1982)

Karena ada anggapan bahwa variabel 𝑦𝑖,𝑡−1 berkorelasi dengan 𝜀𝑖𝑡 . Idenya adalah untuk menemukan

set dari variabel yang kita namakan sebagai instrument, kita tahu bahwa 𝑦𝑖,𝑡−1 tidak boleh berkorelasi

dengan 𝜀𝑖𝑡 . Kemudian instrumental variabel ini ingin mengeliminasi adanya correlation tadi.

- GMM (Arellano and Bond, 1985)

GMM (Generalized Method of Moment) merupakan pilihan metode yang relevan dikarenakan

2(dua) alasan utama yaitu : Pertama, GMM merupakan common estimator dan memberikan

kerangka yang lebih bermanfaat untuk perbandingan dan penilaian. Kedua, GMM memberikan

alternatif yang sederhana terhadap estimator lainnya, terutama terhadap maximum likelihood.
30 Catatan dan Pembahasan Soal Ekonometrika

Namun terdapat juga beberapa kelemahan GMM. Pertama, GMM estimator adalah

asymptotically efficient dalam ukuran contoh besar tetapi kurang efisien dalam ukuran contoh
yang terbatas (finite). Kedua, GMM estimator ini terkadang memerlukan sejumlah implementasi

pemrograman sehingga dibutuhkan suatu perangkat lunak (software) yang mendukung aplikasi

pendekatan GMM

Aplikasi STATA untuk Analisis Panel Data (lihat do file Panel Data Pada Lampiran)

Langkah-langkah penentuan model dalam analisis data panel: gunakan data panel101

Sebelum run data panel, data perlu di set sebagai bentuk data panel
*============================================================

* 1. Declare bahwa data yang digunakan merupakan data panel

*============================================================

*egen negara=group(country) // menyatakan bahwa data yang digunakan panel data (variabel tidak
boleh dalam bentuk string)

sort country year // mengurutkan data panel

xtset country year // declare sebagai data panel

*=====================================

* 2. Menganalisa data dengan grafik

*=====================================

xtline y
31 Catatan dan Pembahasan Soal Ekonometrika

1.000e+10

A B C
5.000e+09
-5.000e+09

0
-1.000e+10
1.000e+10

D E F
5.000e+09
-5.000e+09

0
-1.000e+10

1990 1995 20001990 1995 2000


1.000e+10

G
5.000e+09
-5.000e+09

0
-1.000e+10

1990 1995 2000


year
Graphs by country

*Grafik dijadikan satu

xtline y, overlay
1.000e+10
5.000e+09

0
y
-5.000e+09
-1.000e+10

1990 1992 1994 1996 1998 2000


year

A B
C D
E F
G
32 Catatan dan Pembahasan Soal Ekonometrika

bysort country: egen y_mean=mean(y)

bysort country: egen y_min=min(y)

bysort country: egen y_sum=sum(y)

twoway scatter y country, msymbol(circle_hollow) || connected y_mean country, msymbol(diamond)


|| , xlabel(1 "A" 2 "B" 3 "C" 4 "D" 5 "E" 6 "F" 7 "G")
5.000e+09 1.000e+10

0
-1.000e+10-5.000e+09

A B C D E F G
country

y y_mean

bysort year: egen y_mean1=mean(y)

twoway scatter y year, msymbol(circle_hollow) || connected y_mean1 year, msymbol(diamond) || ,


xlabel(1990(1)1999)
5.000e+09 1.000e+10 33 Catatan dan Pembahasan Soal Ekonometrika

0
-1.000e+10-5.000e+09

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
year

y y_mean1

*==========================================

*3. Pooled Least Square

*==========================================

. reg y x1

Source | SS df MS Number of obs = 70


-------------+---------------------------------- F(1, 68) = 0.40
Model | 3.7039e+18 1 3.7039e+18 Prob > F = 0.5272
Residual | 6.2359e+20 68 9.1705e+18 R-squared = 0.0059
-------------+---------------------------------- Adj R-squared = -0.0087
Total | 6.2729e+20 69 9.0912e+18 Root MSE = 3.0e+09

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 4.95e+08 7.79e+08 0.64 0.527 -1.06e+09 2.05e+09
_cons | 1.52e+09 6.21e+08 2.45 0.017 2.85e+08 2.76e+09
------------------------------------------------------------------------------
34 Catatan dan Pembahasan Soal Ekonometrika

twoway scatter y x1, mlabel(country) || lfit y x1, clstyle(p2)


5.000e+09 1.000e+10

D F
F

F D D
D D E
F C
F D E B C F C
A A A F C GG
A A A B B GG
E C G
D D E B
F A E G G G C
E AA E E GB F C E
0

D B C
B
B G C
D AB
-1.000e+10-5.000e+09

C
F
B

-.5 0 .5 1 1.5
x1

y Fitted values

*==========================================

*4. Least Square Dummy Variable (LSDV)

*==========================================

regress y x1 i.country

Source | SS df MS Number of obs = 70


-------------+---------------------------------- F(7, 62) = 2.61
Model | 1.4276e+20 7 2.0394e+19 Prob > F = 0.0199
Residual | 4.8454e+20 62 7.8151e+18 R-squared = 0.2276
-------------+---------------------------------- Adj R-squared = 0.1404
Total | 6.2729e+20 69 9.0912e+18 Root MSE = 2.8e+09

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 2.48e+09 1.11e+09 2.24 0.029 2.63e+08 4.69e+09
|
country |
B | -1.94e+09 1.26e+09 -1.53 0.130 -4.47e+09 5.89e+08
C | -2.60e+09 1.60e+09 -1.63 0.108 -5.79e+09 5.87e+08
D | 2.28e+09 1.26e+09 1.81 0.075 -2.39e+08 4.80e+09
E | -1.48e+09 1.27e+09 -1.17 0.247 -4.02e+09 1.05e+09
F | 1.13e+09 1.29e+09 0.88 0.384 -1.45e+09 3.71e+09
G | -1.87e+09 1.50e+09 -1.25 0.218 -4.86e+09 1.13e+09
|
_cons | 8.81e+08 9.62e+08 0.92 0.363 -1.04e+09 2.80e+09
------------------------------------------------------------------------------
35 Catatan dan Pembahasan Soal Ekonometrika

predict yhat

separate y, by(country)

separate yhat, by(country)

twoway connected yhat1-yhat7 x1, msymbol(none diamond_hollow triangle_hollow square_hollow


+ circle_hollow x) msize(medium) mcolor(black black black black black black black) || lfit y x1,
clwidth(thick) clcolor(black)
2.00e+094.00e+096.00e+09

0
-2.00e+09

-.5 0 .5 1 1.5
x1

yhat, country == A yhat, country == B


yhat, country == C yhat, country == D
yhat, country == E yhat, country == F
yhat, country == G Fitted values

*membandingkan hasil

. regress y x1

Source | SS df MS Number of obs = 70


-------------+---------------------------------- F(1, 68) = 0.40
Model | 3.7039e+18 1 3.7039e+18 Prob > F = 0.5272
Residual | 6.2359e+20 68 9.1705e+18 R-squared = 0.0059
-------------+---------------------------------- Adj R-squared = -0.0087
Total | 6.2729e+20 69 9.0912e+18 Root MSE = 3.0e+09

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 4.95e+08 7.79e+08 0.64 0.527 -1.06e+09 2.05e+09
_cons | 1.52e+09 6.21e+08 2.45 0.017 2.85e+08 2.76e+09
------------------------------------------------------------------------------
36 Catatan dan Pembahasan Soal Ekonometrika

. estimates store pls


.
. regress y x1 i.country

Source | SS df MS Number of obs = 70


-------------+---------------------------------- F(7, 62) = 2.61
Model | 1.4276e+20 7 2.0394e+19 Prob > F = 0.0199
Residual | 4.8454e+20 62 7.8151e+18 R-squared = 0.2276
-------------+---------------------------------- Adj R-squared = 0.1404
Total | 6.2729e+20 69 9.0912e+18 Root MSE = 2.8e+09

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 2.48e+09 1.11e+09 2.24 0.029 2.63e+08 4.69e+09
|
country |
B | -1.94e+09 1.26e+09 -1.53 0.130 -4.47e+09 5.89e+08
C | -2.60e+09 1.60e+09 -1.63 0.108 -5.79e+09 5.87e+08
D | 2.28e+09 1.26e+09 1.81 0.075 -2.39e+08 4.80e+09
E | -1.48e+09 1.27e+09 -1.17 0.247 -4.02e+09 1.05e+09
F | 1.13e+09 1.29e+09 0.88 0.384 -1.45e+09 3.71e+09
G | -1.87e+09 1.50e+09 -1.25 0.218 -4.86e+09 1.13e+09
|
_cons | 8.81e+08 9.62e+08 0.92 0.363 -1.04e+09 2.80e+09
------------------------------------------------------------------------------

estimates store lsdv

estout pls lsdv,cells(b(star fmt(%9.3f)) se(par)) stats(r2 N, fmt(%9.3f %9.0g) labels(R-squared)) legend

--------------------------------------------
pls lsdv
b/se b/se
--------------------------------------------
x1 4.95e+08 2.48e+09*
(7.79e+08) (1.11e+09)
1.country 0.000
(.)
2.country -1.94e+09
(1.26e+09)
3.country -2.60e+09
(1.60e+09)
4.country 2.28e+09
(1.26e+09)
5.country -1.48e+09
(1.27e+09)
6.country 1.13e+09
(1.29e+09)
7.country -1.87e+09
(1.50e+09)
_cons 1.52e+09* 8.81e+08
(6.21e+08) (9.62e+08)
--------------------------------------------
R-squared 0.006 0.228
N 70 70
--------------------------------------------
* p<0.05, ** p<0.01, *** p<0.001

.
37 Catatan dan Pembahasan Soal Ekonometrika

*==========================================

*5. Fixed Effect

*==========================================

*Fixed Effect
. xtreg y x1, fe

Fixed-effects (within) regression Number of obs = 70


Group variable: country Number of groups = 7

R-sq: Obs per group:


within = 0.0747 min = 10
between = 0.0763 avg = 10.0
overall = 0.0059 max = 10

F(1,62) = 5.00
corr(u_i, Xb) = -0.5468 Prob > F = 0.0289

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 2.48e+09 1.11e+09 2.24 0.029 2.63e+08 4.69e+09
_cons | 2.41e+08 7.91e+08 0.30 0.762 -1.34e+09 1.82e+09
-------------+----------------------------------------------------------------
sigma_u | 1.818e+09
sigma_e | 2.796e+09
rho | .29726926 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(6, 62) = 2.97 Prob > F = 0.0131

estimates store fe

predict lambda,u
38 Catatan dan Pembahasan Soal Ekonometrika

estout pls lsdv fe,cells(b(star fmt(%9.3f)) se(par)) stats(r2 N, fmt(%9.3f %9.0g) labels(R-squared)) legend

------------------------------------------------------------
pls lsdv fe
b/se b/se b/se
------------------------------------------------------------
x1 4.95e+08 2.48e+09* 2.48e+09*
(7.79e+08) (1.11e+09) (1.11e+09)
1.country 0.000
(.)
2.country -1.94e+09
(1.26e+09)
3.country -2.60e+09
(1.60e+09)
4.country 2.28e+09
(1.26e+09)
5.country -1.48e+09
(1.27e+09)
6.country 1.13e+09
(1.29e+09)
7.country -1.87e+09
(1.50e+09)
_cons 1.52e+09* 8.81e+08 2.41e+08
(6.21e+08) (9.62e+08) (7.91e+08)
------------------------------------------------------------
R-squared 0.006 0.228 0.075
N 70 70 70
------------------------------------------------------------
* p<0.05, ** p<0.01, *** p<0.001

*==========================================

*6. Random Effect

*==========================================

xtreg y x1, re
. xtreg y x1, re

Random-effects GLS regression Number of obs = 70


Group variable: country Number of groups = 7

R-sq: Obs per group:


within = 0.0747 min = 10
between = 0.0763 avg = 10.0
overall = 0.0059 max = 10

Wald chi2(1) = 1.91


corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.1669

------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 1.25e+09 9.02e+08 1.38 0.167 -5.21e+08 3.02e+09
_cons | 1.04e+09 7.91e+08 1.31 0.190 -5.13e+08 2.59e+09
-------------+----------------------------------------------------------------
sigma_u | 1.065e+09
sigma_e | 2.796e+09
rho | .12664193 (fraction of variance due to u_i)
------------------------------------------------------------------------------
39 Catatan dan Pembahasan Soal Ekonometrika

*==========================================

*7. Testing Fixed Effect & Random Effect

*==========================================

*Test Random vs Fixed


xtreg y x1, fe
estimates store fixed
xtreg y x1, re
estimates store random
hausman fixed random
. *Test Random vs Fixed
. xtreg y x1, fe

Fixed-effects (within) regression Number of obs = 70


Group variable: country Number of groups = 7

R-sq: Obs per group:


within = 0.0747 min = 10
between = 0.0763 avg = 10.0
overall = 0.0059 max = 10

F(1,62) = 5.00
corr(u_i, Xb) = -0.5468 Prob > F = 0.0289

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 2.48e+09 1.11e+09 2.24 0.029 2.63e+08 4.69e+09
_cons | 2.41e+08 7.91e+08 0.30 0.762 -1.34e+09 1.82e+09
-------------+----------------------------------------------------------------
sigma_u | 1.818e+09
sigma_e | 2.796e+09
rho | .29726926 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(6, 62) = 2.97 Prob > F = 0.0131

. estimates store fixed

. xtreg y x1, re

Random-effects GLS regression Number of obs = 70


Group variable: country Number of groups = 7

R-sq: Obs per group:


within = 0.0747 min = 10
between = 0.0763 avg = 10.0
overall = 0.0059 max = 10

Wald chi2(1) = 1.91


corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.1669

------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 1.25e+09 9.02e+08 1.38 0.167 -5.21e+08 3.02e+09
_cons | 1.04e+09 7.91e+08 1.31 0.190 -5.13e+08 2.59e+09
-------------+----------------------------------------------------------------
sigma_u | 1.065e+09
sigma_e | 2.796e+09
40 Catatan dan Pembahasan Soal Ekonometrika

rho | .12664193 (fraction of variance due to u_i)


------------------------------------------------------------------------------

. estimates store random

. hausman fixed random

---- Coefficients ----


| (b) (B) (b-B) sqrt(diag(V_b-V_B))
| fixed random Difference S.E.
-------------+----------------------------------------------------------------
x1 | 2.48e+09 1.25e+09 1.23e+09 6.41e+08
------------------------------------------------------------------------------
b = consistent under Ho and Ha; obtained from xtreg
B = inconsistent under Ha, efficient under Ho; obtained from xtreg

Test: Ho: difference in coefficients not systematic

chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B)
= 3.67
Prob>chi2 = 0.0553 → terima H0 sehingga model yang digunakan RE,
masih cek

*====================================================

*8. Testing Heterocedasticity dan Serial Correlation

*====================================================

*Heteroskedasticity
. xtreg y x1, fe robust

Fixed-effects (within) regression Number of obs = 70


Group variable: country Number of groups = 7

R-sq: Obs per group:


within = 0.0747 min = 10
between = 0.0763 avg = 10.0
overall = 0.0059 max = 10

F(1,6) = 2.81
corr(u_i, Xb) = -0.5468 Prob > F = 0.1450

(Std. Err. adjusted for 7 clusters in country)


------------------------------------------------------------------------------
| Robust
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 2.48e+09 1.48e+09 1.68 0.145 -1.14e+09 6.09e+09
_cons | 2.41e+08 9.58e+08 0.25 0.810 -2.10e+09 2.58e+09
-------------+----------------------------------------------------------------
sigma_u | 1.818e+09
sigma_e | 2.796e+09
rho | .29726926 (fraction of variance due to u_i)
------------------------------------------------------------------------------

. xttest3

Modified Wald test for groupwise heteroskedasticity


in fixed effect regression model
41 Catatan dan Pembahasan Soal Ekonometrika

H0: sigma(i)^2 = sigma^2 for all i

chi2 (7) = 42.77


Prob>chi2 = 0.0000 → tolak H0, ada heterocedasticitas

Keterangan:
H0: Homocedasticity
H1: Heterocedasticity

. *Serial correlation
. xtserial y x1

Wooldridge test for autocorrelation in panel data


H0: no first-order autocorrelation
F( 1, 6) = 0.214
Prob > F = 0.6603 → terima H0, no autocorrelation
Keterangan:
H0: No Autocorrelation
H1: Autocorrelation

*panel data yang bebas autokorelasi dan heteroskedastisitas


xtreg y x1, fe cluster(country)
xtgls y x1, panels(hetero) corr(ar1)

. *panel data yang bebas autokorelasi dan heteroskedastisitas


. xtreg y x1, fe cluster(country)

Fixed-effects (within) regression Number of obs = 70


Group variable: country Number of groups = 7

R-sq: Obs per group:


within = 0.0747 min = 10
between = 0.0763 avg = 10.0
overall = 0.0059 max = 10

F(1,6) = 2.81
corr(u_i, Xb) = -0.5468 Prob > F = 0.1450

(Std. Err. adjusted for 7 clusters in country)


------------------------------------------------------------------------------
| Robust
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 2.48e+09 1.48e+09 1.68 0.145 -1.14e+09 6.09e+09
_cons | 2.41e+08 9.58e+08 0.25 0.810 -2.10e+09 2.58e+09
-------------+----------------------------------------------------------------
sigma_u | 1.818e+09
sigma_e | 2.796e+09
rho | .29726926 (fraction of variance due to u_i)
------------------------------------------------------------------------------

. xtgls y x1, panels(hetero) corr(ar1)

Cross-sectional time-series FGLS regression

Coefficients: generalized least squares


Panels: heteroskedastic
Correlation: common AR(1) coefficient for all panels (0.3028)

Estimated covariances = 7 Number of obs = 70


42 Catatan dan Pembahasan Soal Ekonometrika

Estimated autocorrelations = 1 Number of groups = 7


Estimated coefficients = 2 Time periods = 10
Wald chi2(1) = 2.55
Prob > chi2 = 0.1100

------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 1.15e+09 7.18e+08 1.60 0.110 -2.60e+08 2.55e+09
_cons | 7.45e+08 6.42e+08 1.16 0.245 -5.12e+08 2.00e+09
------------------------------------------------------------------------------

Panel Data Dinamis


. xtabond2 y L.y x1 x2 x3, gmm (L.y) iv(x1 x2 x3) nolevel robust small
Favoring space over speed. To switch, type or click on mata: mata set matafavor speed,
perm.
Warning: Number of instruments may be large relative to number of observations.
Warning: Two-step estimated covariance matrix of moments is singular.
Using a generalized inverse to calculate robust weighting matrix for Hansen test.
Difference-in-Sargan/Hansen statistics may be negative.

Dynamic panel-data estimation, one-step difference GMM


------------------------------------------------------------------------------
Group variable: country Number of obs = 56
Time variable : year Number of groups = 7
Number of instruments = 38 Obs per group: min = 8
F(4, 7) = 40.61 avg = 8.00
Prob > F = 0.000 max = 8
------------------------------------------------------------------------------
| Robust
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
y |
L1. | -.0905458 .0685826 -1.32 0.228 -.2527179 .0716264
|
x1 | 1.91e+09 2.71e+09 0.71 0.503 -4.50e+09 8.33e+09
x2 | 1.94e+09 2.21e+09 0.88 0.408 -3.27e+09 7.15e+09
x3 | -1.37e+08 6.85e+08 -0.20 0.847 -1.76e+09 1.48e+09
------------------------------------------------------------------------------
Instruments for first differences equation
Standard
D.(x1 x2 x3)
GMM-type (missing=0, separate instruments for each period unless collapsed)
L(1/9).L.y
------------------------------------------------------------------------------
Arellano-Bond test for AR(1) in first differences: z = -1.36 Pr > z = 0.173
Arellano-Bond test for AR(2) in first differences: z = -1.04 Pr > z = 0.297
------------------------------------------------------------------------------
Sargan test of overid. restrictions: chi2(34) = 51.91 Prob > chi2 = 0.025
(Not robust, but not weakened by many instruments.)
Hansen test of overid. restrictions: chi2(34) = 4.80 Prob > chi2 = 1.000
(Robust, but weakened by many instruments.)

Difference-in-Hansen tests of exogeneity of instrument subsets:


iv(x1 x2 x3)
Hansen test excluding group: chi2(31) = 4.80 Prob > chi2 = 1.000
Difference (null H = exogenous): chi2(3) = 0.00 Prob > chi2 = 1.000

Pakai lag dari dependent


43 Catatan dan Pembahasan Soal Ekonometrika

gen yL1=l.y

(7 missing values generated)

. eststo eq1: reg y yL1 x1 x2 x3

Source | SS df MS Number of obs = 63


-------------+---------------------------------- F(4, 58) = 0.89
Model | 3.1948e+19 4 7.9870e+18 Prob > F = 0.4766
Residual | 5.2133e+20 58 8.9885e+18 R-squared = 0.0577
-------------+---------------------------------- Adj R-squared = -0.0072
Total | 5.5328e+20 62 8.9239e+18 Root MSE = 3.0e+09

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
yL1 | .2349935 .1263437 1.86 0.068 -.017911 .4878979
x1 | 3.00e+08 1.05e+09 0.29 0.775 -1.79e+09 2.39e+09
x2 | 1.20e+07 3.68e+08 0.03 0.974 -7.24e+08 7.48e+08
x3 | 1114868 2.93e+08 0.00 0.997 -5.86e+08 5.88e+08
_cons | 1.40e+09 9.03e+08 1.55 0.126 -4.06e+08 3.21e+09
------------------------------------------------------------------------------

. eststo eq2: xtreg y yL1 x1 x2 x3, fe

Fixed-effects (within) regression Number of obs = 63


Group variable: country Number of groups = 7

R-sq: Obs per group:


within = 0.0595 min = 9
between = 0.0223 avg = 9.0
overall = 0.0002 max = 9

F(4,52) = 0.82
corr(u_i, Xb) = -0.8306 Prob > F = 0.5171

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
yL1 | .0371816 .1414895 0.26 0.794 -.2467379 .3211011
x1 | 1.63e+09 1.59e+09 1.03 0.310 -1.56e+09 4.81e+09
x2 | 1.86e+09 2.26e+09 0.82 0.413 -2.67e+09 6.39e+09
x3 | 2.81e+08 4.06e+08 0.69 0.492 -5.34e+08 1.10e+09
_cons | 3.86e+08 1.15e+09 0.34 0.738 -1.92e+09 2.69e+09
-------------+----------------------------------------------------------------
sigma_u | 2.638e+09
sigma_e | 2.898e+09
rho | .45309087 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(6, 52) = 1.68 Prob > F = 0.1445

. eststo eq3: xtabond2 y yL1 x1 x2 x3, gmm ( yL1 ) iv(x1 x2 x3)


Favoring space over speed. To switch, type or click on mata: mata set matafavor speed,
perm.
Warning: Number of instruments may be large relative to number of observations.

Dynamic panel-data estimation, one-step system GMM


------------------------------------------------------------------------------
Group variable: country Number of obs = 63
Time variable : year Number of groups = 7
Number of instruments = 46 Obs per group: min = 9
Wald chi2(4) = 4.08 avg = 9.00
Prob > chi2 = 0.396 max = 9
44 Catatan dan Pembahasan Soal Ekonometrika

------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
yL1 | .2382133 .123058 1.94 0.053 -.002976 .4794025
x1 | 6.26e+08 1.07e+09 0.59 0.556 -1.46e+09 2.71e+09
x2 | 3.65e+07 3.68e+08 0.10 0.921 -6.85e+08 7.58e+08
x3 | -8.28e+07 2.93e+08 -0.28 0.778 -6.57e+08 4.92e+08
_cons | 1.23e+09 9.09e+08 1.36 0.175 -5.49e+08 3.01e+09
------------------------------------------------------------------------------
Instruments for first differences equation
Standard
D.(x1 x2 x3)
GMM-type (missing=0, separate instruments for each period unless collapsed)
L(1/9).yL1
Instruments for levels equation
Standard
x1 x2 x3
_cons
GMM-type (missing=0, separate instruments for each period unless collapsed)
D.yL1
------------------------------------------------------------------------------
Arellano-Bond test for AR(1) in first differences: z = -1.69 Pr > z = 0.092
Arellano-Bond test for AR(2) in first differences: z = -0.47 Pr > z = 0.641
------------------------------------------------------------------------------
Sargan test of overid. restrictions: chi2(41) = 46.44 Prob > chi2 = 0.258
(Not robust, but not weakened by many instruments.)

Difference-in-Sargan tests of exogeneity of instrument subsets:


GMM instruments for levels
Sargan test excluding group: chi2(34) = 35.83 Prob > chi2 = 0.383
Difference (null H = exogenous): chi2(7) = 10.62 Prob > chi2 = 0.156
iv(x1 x2 x3)
Sargan test excluding group: chi2(38) = 43.30 Prob > chi2 = 0.255
Difference (null H = exogenous): chi2(3) = 3.14 Prob > chi2 = 0.370

. . esttab, b(3) se(3) ar2 star (* .1 ** .05 *** .01)

------------------------------------------------------------
(1) (2) (3)
y y y
------------------------------------------------------------
yL1 0.235* 0.037 0.238*
(0.126) (0.141) (0.123)

x1 3.003e+08 1.626e+09 6.264e+08


(1.046e+09) (1.586e+09) (1.065e+09)

x2 11981842.601 1.860e+09 36509484.624


(3.678e+08) (2.256e+09) (3.681e+08)

x3 1114867.768 2.808e+08 -8.275e+07


(2.932e+08) (4.059e+08) (2.932e+08)

_cons 1.401e+09 3.857e+08 1.233e+09


(9.030e+08) (1.147e+09) (9.090e+08)
------------------------------------------------------------
N 63 63 63
adj. R-sq -0.007 -0.121
------------------------------------------------------------
Standard errors in parentheses
* p<.1, ** p<.05, *** p<.01
45 Catatan dan Pembahasan Soal Ekonometrika

6. LPM, Logit, dan Probit

Model regresi linier menggunakan variabel tergantung yang bersifat numeris dan diasumsikan dapat
mengambil nilai apa saja (unbounded). Asumsi yang terakhir ini pada beberapa penelitian dapat
bersifat kurang realistis. Penelitian dengan variabel tergantung yang bersifat kualitatif (kategorik)
misalnya keputusan membeli atau tidak suatu produk yang dikaitkan dengan serangkaian variabel
bebas (demografis, daya beli dan psikologis). Dalam hal ini nilai regressand hanyalah 1 (jika beli) dan
0 (jika tidak). Model regresi yang digunakan untuk data semacam ini disebut model binary response
diantaranya model linear probability, logit dan probit. Sifat variabel tergantung lain yang
memberikan hambatan bagi penerapan OLS adalah count data. Nilai variabel response harus bersifat
integer dan non negatif. Model Regresi Poisson dapat mengakomodasikan variabel semacam ini.

Jika nilai variabel tergantung adalah kontinu tetapi hanya terbatas pada range tertentu juga
merupakan hambatan bagi penerapan OLS secara langsung. Variabel semacam ini misalnya Indeks
Prestasi, persentase kepesertaan pensiun, nilai TOEFL, dan sebagainya. Data yang dimiliki disebut
censored jika nilai variabel tergantung dibatasi. Model untuk mengatasi masalah ini disebut censored
regression

Akhirnya suatu kualifikasi terhadap OLS juga diberikan pada data yang bersifat truncated. Masalah
truncated terjadi jika ada satu atau lebih sub sample (dengan porsi yang substansial) yang diperoleh
melalui teknik non-random sampling. Seluruh teknik yang dipergunakan untuk mengatasi
permasalahan yang disebut diatas termasuk pada kelas Limited Dependent Variable Model, atau
disingkat LDV Model

Interpretasi hubungan antara variabel dependent dan variabel bebas pada model binary response
adalah bersifat probabilistic. Sehingga, jika kita menotasikan y=1 sebagai terjadinya suatu event (dan
y=0, bukan event tersebut), maka regresi OLSnya.

𝒀 = 𝜷𝟎 + 𝜷𝟏 𝑿𝟏 + 𝜷𝟐 𝑿𝟐 + ⋯ … … … … … . +𝜷𝒌 𝑿𝒌

Harus diinterpretasikan sebagai probabilitas terjadinya y=1, given 𝑋𝑗 tertentu, atau

𝑷(𝒀 = 𝟏|𝑿) = 𝜷𝟎 + 𝜷𝟏 𝑿𝟏 + 𝜷𝟐 𝑿𝟐 + ⋯ … … … … … . +𝜷𝒌 𝑿𝒌

Jika kita menggunakan Linear Probability Model (LPM), maka persamaan di atas diestimasi dari data
dengan menggunakan teknik OLS. Model LPM ini memiliki 2 kelemahan

Pertama, ada pembatasan yang bersifat adhoc. Ini terjadi apabila fitted value dari variabel response
lebih dari 1, maka ia dianggap 1 dan sebaliknya jika dibawah 0, maka akan dianggap 0 (1 dan 0 adalah
46 Catatan dan Pembahasan Soal Ekonometrika

batas atas dan batas bawah dari nilai variabel respon). Dengan demikian fitted value=1.50 adalah
dianggap sama dengan fitted value=1.05, sama-sama memiliki probabilitas terjadinya y= 1.

Kedua, model ini mengalami heteroskedastisitas (melanggar asumsi Gauss-Markov).

Meskipun demikian model ini tetap banyak digunakan dan cukup valid terutama jika nilai dari variabel
bebas terdistribusi disekitar rata-ratanya (tidak terlalu menyebar).

Estimasi model 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢 dengan suatu metode yang akan menjamin bahwa 𝐸(𝑌𝑖|𝑋𝑖) terlatak
antara 0 & 1 adalah dengan menggunakan metode logit dan probit. Apa bedanya?

Model logit menggunakan fungsi fungsi logistic komulatif (comulative logistic function) sedangkan
model probit menggunakan fungsi normal komulatif (normal CDF) → model normit. Secara prinsip,
untuk memperoleh model probit dapat dilakukan dengan mengganti fungsi logistic komulatif pada
persamaan:

𝟏
𝑷𝒊 =
𝟏 + 𝒆−𝒛𝒊

Contoh Soal 6.1

Dinas kesehatan Provinsi Jakarta ingin mengetahui pengaruh faktor jenis kelamin (sex), pemberian
ASI ekslusif (ASI), pemberian imunisasi dasar lengkap (IDL) dan pemberian suplemen penambah
immunitas terhadap kenaikan imunitas balita di suatu kecamatan. Arah dan tingkat pengaruh faktor
akan didekati oleh model logistik dan probit, dengan batasan variabel terikat dan bebas sebagai
berikut:

Variabel terikat: Imun = kenaikan imunitas (1 = ya, 0 = tidak); kemudian variabel-variabel bebas: Sex
= jenis kelamin (1 = laki-laki, 0 = perempuan); ASI = pemberian ASI ekslusif (1=ya, 0 = tidak); IDL =
pemberian imunisasi dasar lengkap (1=ya, 0= tidak); SUPL = pemberian suplemen penambah
immunitas (dalam mg).

Pertanyaan:

Terhadap hasil estimasi model probabilitas dengan pendekatan Probit:

Tulis persamaan model probabilitas dengan pendekatan Probit!

𝑍𝑖∗ = 𝛼0 + 𝛼1 𝑠𝑒𝑥𝑖 + 𝛼2 𝐴𝑆𝐼𝑖 + 𝛼3 𝐼𝐷𝐿𝑖 + 𝛼4 𝑆𝑈𝑃𝐿𝑖 + 𝑢𝑖

Bagaimana pendapat saudara tentang Goodness of Fit dari model ini? Salah satu melihat Goodness
of Fit adalah dari nilai Psedo R2-nya. Berdasarkan hasil output regresi probit tersebut, nilai Psedo R2
47 Catatan dan Pembahasan Soal Ekonometrika

adalah 0.4557 atau 45,57%. Untuk data cross section, nilai tersebut sudah cukup tinggi untuk
menjelaskan model.

Output Model Probit:

Probit regression Number of obs = 43


LR chi2(4) = 27.07
Prob > chi2 = 0.0000
Log likelihood = -16.165323 Pseudo R2 = 0.4557

------------------------------------------------------------------------------
imun | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
sex | .2647858 .5449373 0.49 0.627 -.8032716 1.332843
asi | 1.331317 .5232053 2.54 0.011 .3058532 2.35678
idl | 1.169622 .5210763 2.24 0.025 .1483314 2.190913
supl | .0059836 .0037771 1.58 0.113 -.0014193 .0133865
_cons | -2.534571 .9216112 -2.75 0.006 -4.340895 -.7282457
------------------------------------------------------------------------------
Terhadap hasil estimasi model probabilitas dengan pendekatan Logit:

Interpretasikan makna dari koefisien ASI (satu koefisien saja)!

Berdasarkan output persamaan logit di bawah menunjukkan koefisien ASI positif, artinya pemberian
ASI eksklusif memiliki dampak positif pada kenaikan imunitas balita atau peluang balita yang
diberikan ASI eksklusif mengalami kenaikan imunitas lebih tinggi sebesar exp(2.27728)=9,75 kali
dibandingkan dengan balita yang tidak diberikan ASI

Bagaimana pendapat saudara tentang signifikansi pengaruh dari masing-masing faktor terhadap
peningkatan imunitas? Uraikan jawaban saudara.

Uji signifikansi pada parameter dilakukan dengan melihat nilai p value yang dibandingkan dengan α
(level of significance) yang digunakan pada hipotesis null dua arah. Jika Prob< α maka tolak H0.
Berdasarkan hasil Wald test dengan α=5% menunjukkan:

variabel sex: Prob> α → terima H0, artinya jenis kelamin balita tidak signifikan memengaruhi kenaikan
imunitas balita

variabel asi: Prob< α → tolak H0, artinya pemberian ASI ekslusif pada balita signifikan memengaruhi
kenaikan imunitas balita

variabel idl: Prob< α → tolak H0, artinya pemberian imunisasi dasar lengkap pada balita signifikan
memengaruhi kenaikan imunitas balita

variabel supl: Prob> α → terima H0, artinya pemberian suplemen penambah imunitas pada balita
tidak signifikan memengaruhi kenaikan imunitas balita
48 Catatan dan Pembahasan Soal Ekonometrika

Jika seorang bayi adalah perempuan, tidak diberi ASI ekslusif, tidak diberi imunisasi dasar lengkap,
dan diberi suplemen penambah imun sebesar 250 mgram. Berapa probabilitas bayi tersebut
mengalami kenaikan imunitas?

𝒑
𝒍𝒏 ( ) = −𝟒. 𝟐𝟗𝟐𝟑𝟑𝟖 + 𝟎. 𝟎𝟎𝟗𝟗𝟔𝟏𝟖 ∗ 𝟐𝟓𝟎
𝟏−𝒑
𝒑
𝒍𝒏 ( ) = −1.80189
𝟏−𝒑
𝒑
( ) = 𝒆−1.80189
𝟏−𝒑

𝒆−1.80189
𝒑= = 𝟏𝟒, 𝟏𝟔%
𝟏 + 𝒆−1.80189

Output Model Logistic:

Logistic regression Number of obs = 43


LR chi2(4) = 26.80
Prob > chi2 = 0.0000
Log likelihood = -16.300305 Pseudo R2 = 0.4512

------------------------------------------------------------------------------
imun | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
sex | .3540409 .97776 0.36 0.717 -1.562333 2.270415
asi | 2.27728 .9202925 2.47 0.013 .4735401 4.081021
idl | 1.99327 .920426 2.17 0.030 .1892681 3.797272
supl | .0099618 .0067522 1.48 0.140 -.0032723 .0231959
_cons | -4.292338 1.743733 -2.46 0.014 -7.709992 -.8746841
----------------------------------------------------------------------------

Lampiran Output STATA

Gunakan Data Panel101

. logit y_bin x1 x2 x3

Iteration 0: log likelihood = -35.02817


Iteration 1: log likelihood = -33.047869
Iteration 2: log likelihood = -32.75873
Iteration 3: log likelihood = -32.756102
Iteration 4: log likelihood = -32.756101

Logistic regression Number of obs = 70


LR chi2(3) = 4.54
Prob > chi2 = 0.2084
Log likelihood = -32.756101 Pseudo R2 = 0.0649

------------------------------------------------------------------------------
y_bin | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | .861772 .7840201 1.10 0.272 -.674879 2.398423
x2 | .3665348 .3081647 1.19 0.234 -.2374569 .9705264
x3 | .7512113 .4548642 1.65 0.099 -.1403061 1.642729
_cons | .4261935 .6390496 0.67 0.505 -.8263207 1.678708
49 Catatan dan Pembahasan Soal Ekonometrika

------------------------------------------------------------------------------

. predict y_bin_hat
(option pr assumed; Pr(y_bin))

. logit y_bin x1 x2 x3, or

Iteration 0: log likelihood = -35.02817


Iteration 1: log likelihood = -33.047869
Iteration 2: log likelihood = -32.75873
Iteration 3: log likelihood = -32.756102
Iteration 4: log likelihood = -32.756101

Logistic regression Number of obs = 70


LR chi2(3) = 4.54
Prob > chi2 = 0.2084
Log likelihood = -32.756101 Pseudo R2 = 0.0649

------------------------------------------------------------------------------
y_bin | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 2.367352 1.856051 1.10 0.272 .509218 11.00581
x2 | 1.442727 .4445974 1.19 0.234 .7886309 2.639334
x3 | 2.119566 .9641146 1.65 0.099 .8690922 5.169256
_cons | 1.531417 .9786515 0.67 0.505 .4376566 5.358627
------------------------------------------------------------------------------
Marginal effect: perubahan peluang akibat kenaikan 1 unit x (untuk variabel continue)
Odd ratio: untuk variabel dummy
. mfx

Marginal effects after logit


y = Pr(y_bin) (predict)
= .83285547
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
x1 | .1199649 .10484 1.14 0.253 -.085513 .325443 .648001
x2 | .0510243 .04116 1.24 0.215 -.029639 .131687 .133869
x3 | .1045741 .05389 1.94 0.052 -.001053 .210201 .761851
------------------------------------------------------------------------------

7. Ordered Logit dan Multinomial Logit

Jika sebuah variabel terikat memiliki lebih dari dua kategori dan nilai masing-masing kategori
memiliki arti sequential berurutan, sebuah nilai lebih tinggi dibandingkan dengan kategori
sebelumnya, maka kita dapat menggunakan ordinal logit.

Gunakan Data nels_small

Pertama, tabulasi variabel psechoice: keputusan setelah lulus SMA


50 Catatan dan Pembahasan Soal Ekonometrika

. ta psechoice

no college |
= 1, 2 = |
2-year |
college, 3 |
= 4-year |
college | Freq. Percent Cum.
------------+-----------------------------------
1 | 222 22.20 22.20
2 | 251 25.10 47.30
3 | 527 52.70 100.00
------------+-----------------------------------
Total | 1,000 100.00

1= Jika memutuskan untuk tidak kuliah


2=kuliah diploma (2 tahun)
3=kuliah S1 (4 tahun)

Lakukan regresi ordered logit sebagai berikut:

. ologit psechoice grades faminc female

Iteration 0: log likelihood = -1018.6575


Iteration 1: log likelihood = -862.08132
Iteration 2: log likelihood = -857.37978
Iteration 3: log likelihood = -857.35994
Iteration 4: log likelihood = -857.35994

Ordered logistic regression Number of obs = 1,000


LR chi2(3) = 322.60
Prob > chi2 = 0.0000
Log likelihood = -857.35994 Pseudo R2 = 0.1583

------------------------------------------------------------------------------
psechoice | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grades | -.4949494 .0349293 -14.17 0.000 -.5634096 -.4264891
faminc | .0129831 .0022959 5.65 0.000 .0084831 .017483
female | -.1389161 .1344196 -1.03 0.301 -.4023736 .1245414
-------------+----------------------------------------------------------------
/cut1 | -4.293049 .3126031 -4.90574 -3.680358
/cut2 | -2.806587 .2930885 -3.38103 -2.232144
------------------------------------------------------------------------------

Sama hal-nya dengan logit, output dari ordered logit tidak bisa langsung diinterpresikan
dari koefisiennya. Namun dapat dihitung melali nilai margins-nya.
51 Catatan dan Pembahasan Soal Ekonometrika

. margins, predict(outcome(1)) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==1), predict(outcome(1))


at : grades = 6.53039 (mean)
faminc = 51.3935 (mean)
female = .496 (mean)

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .1598722 .0123627 12.93 0.000 .1356418 .1841027
------------------------------------------------------------------------------

Jadi dengan asumsi rata-rata semua nilai variabel bebasnya, maka peluang individu untuk
memilih tidak sekolah adalah sebesar 15,98 persen.

. margins, predict(outcome(2)) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==2), predict(outcome(2))


at : grades = 6.53039 (mean)
faminc = 51.3935 (mean)
female = .496 (mean)

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .2970556 .0164593 18.05 0.000 .2647961 .3293152
------------------------------------------------------------------------------

Jadi dengan asumsi rata-rata semua nilai variabel bebasnya, maka peluang individu untuk
memilih kuliah 2 tahun (Diploma) adalah sebesar 29,7 persen.

. margins, predict(outcome(3)) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==3), predict(outcome(3))


at : grades = 6.53039 (mean)
faminc = 51.3935 (mean)
female = .496 (mean)

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .5430721 .0183613 29.58 0.000 .5070847 .5790596
------------------------------------------------------------------------------

Jadi dengan asumsi rata-rata semua nilai variabel bebasnya, maka peluang individu untuk
memilih kuliah 4 tahun (S1) adalah sebesar 54,3 persen.
52 Catatan dan Pembahasan Soal Ekonometrika

. margins, predict(outcome(1)) at(female=1) atmeans

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==1), predict(outcome(1))


at : grades = 6.53039 (mean)
faminc = 51.3935 (mean)
female = 1

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .1695014 .015722 10.78 0.000 .1386868 .2003159
------------------------------------------------------------------------------

Jadi dengan asumsi nilai grades rata-rata, pendapatan rumah tangga rata-rata, dan
perempuan, maka peluang individu untuk memilih tidak kuliah adalah sebesar 16,95 persen.

. margins, predict(outcome(1)) at(female=0) atmeans

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==1), predict(outcome(1))


at : grades = 6.53039 (mean)
faminc = 51.3935 (mean)
female = 0

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .1508332 .0148797 10.14 0.000 .1216695 .1799968
------------------------------------------------------------------------------

Jadi dengan asumsi nilai grades rata-rata, pendapatan rumah tangga rata-rata, dan laki-
laki, maka peluang individu untuk memilih tidak kuliah adalah sebesar 15,08 persen.

Lakukan summarize untuk dua variabel bebas yakni grades dan faminc

. sum grades faminc

Variable | Obs Mean Std. Dev. Min Max


-------------+---------------------------------------------------------
grades | 1,000 6.53039 2.265855 1.74 12.33
faminc | 1,000 51.3935 40.16579 0 250
53 Catatan dan Pembahasan Soal Ekonometrika

. margins, predict(outcome(3)) at(female=1 grades=1.74 faminc=250) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==3), predict(outcome(3))


at : grades = 1.74
faminc = 250
female = 1

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .9936455 .0031492 315.52 0.000 .9874731 .9998179
------------------------------------------------------------------------------

Jadi dengan asumsi nilai grades 1,74 (maksimum), pendapatan rumah tangga sebesar 250
(maksimum), dan perempuan, maka peluang individu untuk memilih kuliah S1 adalah sebesar
99,36 persen.

. margins, predict(outcome(3)) at(female=0 grades=1.74 faminc=250) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==3), predict(outcome(3))


at : grades = 1.74
faminc = 250
female = 0

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .9944651 .0027943 355.89 0.000 .9889884 .9999418
------------------------------------------------------------------------------

Jadi dengan asumsi nilai grades 1,74 (maksimum), pendapatan rumah tangga sebesar 250
(maksimum), dan laki-laki, maka peluang individu untuk memilih kuliah S1 adalah sebesar
99,45 persen.

Peluang laki-laki lebih untuk kuliah dibandingkan dengan perempuan untuk individu dengan
karakteristik nilai grades 1,74, pendapatan rumah tangga sebesar 250.

. margins, predict(outcome(3)) at(female=1 grades=12 faminc=10) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==3), predict(outcome(3))


at : grades = 12
faminc = 10
female = 1

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .041412 .0091823 4.51 0.000 .023415 .0594089
------------------------------------------------------------------------------
54 Catatan dan Pembahasan Soal Ekonometrika

Jadi dengan asumsi nilai grades 12, pendapatan rumah tangga 10, dan perempuan, maka
peluang individu untuk memilih kuliah S1 adalah sebesar 4,14 persen.

. margins, predict(outcome(1)) at(female=1 grades=12 faminc=10) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==1), predict(outcome(1))


at : grades = 12
faminc = 10
female = 1

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .8396235 .0287551 29.20 0.000 .7832645 .8959825
------------------------------------------------------------------------------

Jadi dengan asumsi nilai grades 12, pendapatan rumah tangga 10, dan perempuan, maka
peluang individu untuk memilih tidak melanjutkan kuliah adalah adalah sebesar 83,97
persen.

Apa perbedaannya dengan Multinomial Logit?

Jika sebuah variabel terikat memiliki lebih dari dua kategori dan nilai masing-masing kategori
memiliki tidak berurutan nilainya, misalnya pilihan untuk moda transportasi, maka menggunakan
multinomial logit.

. ologit psechoice grades

Iteration 0: log likelihood = -1018.6575


Iteration 1: log likelihood = -879.94915
Iteration 2: log likelihood = -877.29967
Iteration 3: log likelihood = -877.29561
Iteration 4: log likelihood = -877.29561

Ordered logistic regression Number of obs = 1,000


LR chi2(1) = 282.72
Prob > chi2 = 0.0000
Log likelihood = -877.29561 Pseudo R2 = 0.1388

------------------------------------------------------------------------------
psechoice | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grades | -.5101479 .0339269 -15.04 0.000 -.5766433 -.4436525
-------------+----------------------------------------------------------------
/cut1 | -4.916916 .2672764 -5.440768 -4.393064
/cut2 | -3.477195 .2416765 -3.950873 -3.003518
------------------------------------------------------------------------------
55 Catatan dan Pembahasan Soal Ekonometrika

. margins, predict(outcome(1)) at(grades=12) atmeans post

Adjusted predictions Number of obs = 1,000


Model VCE : OIM

Expression : Pr(psechoice==1), predict(outcome(1))


at : grades = 12

------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .769388 .0308422 24.95 0.000 .7089383 .8298376
------------------------------------------------------------------------------

. mlogit psechoice grades

Iteration 0: log likelihood = -1018.6575


Iteration 1: log likelihood = -881.68524
Iteration 2: log likelihood = -875.36084
Iteration 3: log likelihood = -875.31309
Iteration 4: log likelihood = -875.31309

Multinomial logistic regression Number of obs = 1,000


LR chi2(2) = 286.69
Prob > chi2 = 0.0000
Log likelihood = -875.31309 Pseudo R2 = 0.1407

------------------------------------------------------------------------------
psechoice | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
1 |
grades | .7061967 .0529246 13.34 0.000 .6024664 .809927
_cons | -5.769876 .4043229 -14.27 0.000 -6.562334 -4.977417
-------------+----------------------------------------------------------------
2 |
grades | .3974077 .0416925 9.53 0.000 .3156919 .4791236
_cons | -3.263454 .2875495 -11.35 0.000 -3.827041 -2.699868
-------------+----------------------------------------------------------------
3 | (base outcome)
------------------------------------------------------------------------------

. mfx, predict(outcome(1)) at(12)

Marginal effects after mlogit


y = Pr(psechoice==1) (predict, outcome(1))
= .73078768
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
grades | .0749498 .00487 15.40 0.000 .065412 .084488 12
------------------------------------------------------------------------------
56 Catatan dan Pembahasan Soal Ekonometrika

. mfx, predict(outcome(2)) at(12)

Marginal effects after mlogit


y = Pr(psechoice==2) (predict, outcome(2))
= .22031912
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
grades | -.0454361 .00501 -9.06 0.000 -.05526 -.035612 12
------------------------------------------------------------------------------
. mfx, predict(outcome(3)) at(12)

Marginal effects after mlogit


y = Pr(psechoice==3) (predict, outcome(3))
= .0488932
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
grades | -.0295137 .0042 -7.03 0.000 -.037737 -.02129 12
------------------------------------------------------------------------------

Perbedaan Hasil Estimasi LPM, Logit, dan Probit


. eststo eq1: reg inlf nwifeinc educ exper expersq age kidslt6 kidsge6

Source | SS df MS Number of obs = 753


-------------+---------------------------------- F(7, 745) = 38.22
Model | 48.8080578 7 6.97257969 Prob > F = 0.0000
Residual | 135.919698 745 .182442547 R-squared = 0.2642
-------------+---------------------------------- Adj R-squared = 0.2573
Total | 184.727756 752 .245648611 Root MSE = .42713

------------------------------------------------------------------------------
inlf | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
nwifeinc | -.0034052 .0014485 -2.35 0.019 -.0062488 -.0005616
educ | .0379953 .007376 5.15 0.000 .023515 .0524756
exper | .0394924 .0056727 6.96 0.000 .0283561 .0506287
expersq | -.0005963 .0001848 -3.23 0.001 -.0009591 -.0002335
age | -.0160908 .0024847 -6.48 0.000 -.0209686 -.011213
kidslt6 | -.2618105 .0335058 -7.81 0.000 -.3275875 -.1960335
kidsge6 | .0130122 .013196 0.99 0.324 -.0128935 .0389179
_cons | .5855192 .154178 3.80 0.000 .2828442 .8881943
------------------------------------------------------------------------------
57 Catatan dan Pembahasan Soal Ekonometrika

. eststo eq2: logit inlf nwifeinc educ exper expersq age kidslt6 kidsge6

Iteration 0: log likelihood = -514.8732


Iteration 1: log likelihood = -402.38502
Iteration 2: log likelihood = -401.76569
Iteration 3: log likelihood = -401.76515
Iteration 4: log likelihood = -401.76515

Logistic regression Number of obs = 753


LR chi2(7) = 226.22
Prob > chi2 = 0.0000
Log likelihood = -401.76515 Pseudo R2 = 0.2197

------------------------------------------------------------------------------
inlf | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
nwifeinc | -.0213452 .0084214 -2.53 0.011 -.0378509 -.0048394
educ | .2211704 .0434396 5.09 0.000 .1360303 .3063105
exper | .2058695 .0320569 6.42 0.000 .1430391 .2686999
expersq | -.0031541 .0010161 -3.10 0.002 -.0051456 -.0011626
age | -.0880244 .014573 -6.04 0.000 -.116587 -.0594618
kidslt6 | -1.443354 .2035849 -7.09 0.000 -1.842373 -1.044335
kidsge6 | .0601122 .0747897 0.80 0.422 -.086473 .2066974
_cons | .4254524 .8603697 0.49 0.621 -1.260841 2.111746
------------------------------------------------------------------------------

. eststo eq3: probit inlf nwifeinc educ exper expersq age kidslt6 kidsge6

Iteration 0: log likelihood = -514.8732


Iteration 1: log likelihood = -402.06651
Iteration 2: log likelihood = -401.30273
Iteration 3: log likelihood = -401.30219
Iteration 4: log likelihood = -401.30219

Probit regression Number of obs = 753


LR chi2(7) = 227.14
Prob > chi2 = 0.0000
Log likelihood = -401.30219 Pseudo R2 = 0.2206

------------------------------------------------------------------------------
inlf | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
nwifeinc | -.0120237 .0048398 -2.48 0.013 -.0215096 -.0025378
educ | .1309047 .0252542 5.18 0.000 .0814074 .180402
exper | .1233476 .0187164 6.59 0.000 .0866641 .1600311
expersq | -.0018871 .0006 -3.15 0.002 -.003063 -.0007111
age | -.0528527 .0084772 -6.23 0.000 -.0694678 -.0362376
kidslt6 | -.8683285 .1185223 -7.33 0.000 -1.100628 -.636029
kidsge6 | .036005 .0434768 0.83 0.408 -.049208 .1212179
_cons | .2700768 .508593 0.53 0.595 -.7267473 1.266901
------------------------------------------------------------------------------
58 Catatan dan Pembahasan Soal Ekonometrika

. esttab, b(3) se(3) ar2 star (* .1 ** .05 *** .01)

------------------------------------------------------------
(1) (2) (3)
inlf inlf inlf
------------------------------------------------------------
main
nwifeinc -0.003** -0.021** -0.012**
(0.001) (0.008) (0.005)

educ 0.038*** 0.221*** 0.131***


(0.007) (0.043) (0.025)

exper 0.039*** 0.206*** 0.123***


(0.006) (0.032) (0.019)

expersq -0.001*** -0.003*** -0.002***


(0.000) (0.001) (0.001)

age -0.016*** -0.088*** -0.053***


(0.002) (0.015) (0.008)

kidslt6 -0.262*** -1.443*** -0.868***


(0.034) (0.204) (0.119)

kidsge6 0.013 0.060 0.036


(0.013) (0.075) (0.043)

_cons 0.586*** 0.425 0.270


(0.154) (0.860) (0.509)
------------------------------------------------------------
N 753 753 753
adj. R-sq 0.257
------------------------------------------------------------
Standard errors in parentheses
* p<.1, ** p<.05, *** p<.01

Catatan ini diadopsi dari:

Djoni Hartono. 2020. Catatan Kuliah MEKK di Kelas


Djoni Hartono. 2019. Model Limited Dependent Variabel. Bahan Kuliah MEKK

………………………2011. Topik Lanjutan Model Regresi Linier. Bahan Kuliah PPIE

Indrayanti, Ratna. 2019. Catatan dan Pembahasan Soal Ekonometrika

Nachrowi, D. Nachrowi dan Hardius Usman. 2002. Edisi Revisi. Penggunaan Teknik Ekonometri.
Penerbit Rajawali. Jakarta

Torres, Oscar and Reyna. Panel Data Analysis Fixed & Random Effects (using Stata 10.x). Pricenton
University

Torres, Oscar and Reyna. Getting Started in Logit and Ordered Logit Regression. Pricenton University
59 Catatan dan Pembahasan Soal Ekonometrika

Torres, Oscar and Reyna. Predicted Probabilities and marginal effects after (ordered) logit/probit
using margis in Stata. Pricenton University

Wooldridge, Jeffrey M. 2013. Introductory Econometrics: A Modern Approach

View publication stats

Anda mungkin juga menyukai