Anda di halaman 1dari 48

"POOLING CROSS SECTIONS

ACROSS TIME: SIMPLE


PANEL DATA METHODS"
EKONOMETRIKA LANJUTAN
Anggota Kelompok 1:

1 2 3 4

Frima Halasson Kadek Aglena Fransiska Kadek Dwi


Rajagukguk Parisesa Vistalia Alo Reditiani
(1907511265) (1907511076) (1907511247) (1907511257)
Pokok Pembahasan:

1 2 3
Pooling Analisis Kebijakan Analisis Data
Independent dengan Crossed Panel Dua Periode
Cross Sections Section
across Time

4 5
Analisis Kebijakan Differencing
dengan Dua dengan Lebih dari
Periode Dua Periode
01
Pooling Independent Cross Sections across Time
Pooling Independent Cross Sections across Time

Banyak survei individu, keluarga, dan perusahaan diulangi secara berkala, seringkali setiap
tahun. Sebuah contohnya adalah Survei Penduduk Saat Ini (CPS), yang secara acak mengambil
sampel rumah tangga setiap tahun. (Lihat, misalnya, CPS78_85, yang berisi data dari CPS 1978
dan 1985). Jika sampel acak diambil pada setiap periode waktu, mengumpulkan sampel acak
yang dihasilkan memberi kita gabungan secara independent persilangan.

Salah satu alasan untuk menggunakan perpotongan atau persilangan yang dikumpulkan secara
independen adalah untuk meningkatkan ukuran sampel. Dengan mengumpulkan sampel acak
yang diambil dari populasi yang sama, tetapi pada titik waktu yang berbeda, kita bisa
mendapatkan lebih banyak penduga yang tepat dan statistik uji dengan kekuatan lebih besar.
Pooling sangat membantu dalam hal ini hanya sejauh hubungan antara variabel dependen dan
setidaknya beberapa variabel independen tetap ada konstan sepanjang waktu.
Dimana dengan menggunakan perpotongan atau persilangan
yang dikumpulkan mengumpulkan hanya komplikasi statistik
kecil. Biasanya, untuk mencerminkan fakta bahwa populasi
mungkin memiliki distribusi yang berbeda pula periode
waktu, kami memungkinkan intersepsi berbeda antar
periode, biasanya tahun. Ini mudah dilakukan dengan
memasukkan variabel dummy untuk semua kecuali satu
tahun, di mana tahun paling awal dalam sampel adalah
biasanya dipilih sebagai tahun dasar.
Contoh 13.2
Changes in the Return to Education and the Gender
Wage Gap

Persamaan log (upah) (di mana upah adalah upah per jam) dikumpulkan selama tahun 1978 (tahun
dasar) dan 1985 adalah

di mana sebagian besar variabel penjelas sekarang sudah tidak asing lagi. Serikat variabel adalah
variable dummy sama dengan satu jika orang itu milik serikat, dan nol sebaliknya. Variabel y85 adalah
dummy variabel sama dengan satu jika pengamatan berasal dari tahun 1985 dan nol jika berasal dari
tahun 1978. Ada 550 orang dalam sampel pada tahun 1978 dan satu set berbeda 534 orang pada
tahun 1985.
Intercept untuk 1978 adalah β0, dan intersep untuk 1985 adalah β0 + δ0. Kembali ke
pendidikan di Indonesia 1978 adalah β1, dan kembali ke pendidikan pada tahun 1985 adalah β1 +
δ1. Karena itu, δ1 mengukur bagaimana kembalinya kesatu tahun lagi pendidikan setelah berubah
selama periode tujuh tahun. Akhirnya, pada tahun 1978, perbedaan log (upah) antara perempuan
dan laki-laki adalah β5; diferensial pada tahun 1985 adalah β5 + δ5. Jadi, kita bisa menguji nol
hipotesis bahwa tidak ada yang terjadi pada perbedaan gender selama periode tujuh tahun ini
dengan pengujian H0: δ5 = 0. Alternatif yang mengurangi perbedaan gender adalah H1: δ5 > 0.
Untuk kesederhanaan, kami berasumsi bahwa pengalaman dan keanggotaan serikat memiliki efek
yang sama terhadap upah di kedua waktu tersebut.
Sementara wage1 berbeda antar orang, P85 tidak. Oleh karena itu, log (P85) akan diserap ke dalam
intersep untuk 1985. (Kesimpulan ini akan berubah jika, misalnya, kami menggunakan indeks harga
yang berbeda untuk orang yang tinggal di berbagai bagian negara.) Intinya adalah, untuk mempelajari
bagaimana kembali ke pendidikan atau kesenjangan gender telah berubah, kita tidak perlu mengubah
upah nominal menjadi upah riil di Indonesia persamaan (13.1).

Sekarang, menggunakan data dalam CPS78_85 untuk memperkirakan persamaan:


Sebelum menyajikan estimasi, ada satu masalah lain yaitu, setiap jam
upah di sini adalah dalam dolar nominal (atau saat ini). Karena upah
nominal tumbuh hanya karena inflasi, kami benar-benar tertarik pada
pengaruh masing-masing variabel penjelas terhadap upah riil. Misalkan
kita sepakat untuk mengukur upah pada tahun 1978 dolar. Ini
membutuhkan upah 1985 dikurangi menjadi 1978 dolar. (Menggunakan
Indeks Harga Konsumen untuk Laporan Ekonomi Presiden 1997, faktor
deflasi adalah 107.6 / 65.2 <1.65.) Meskipun kita dapat dengan mudah
membagi masing-masing upah 1985 dengan 1,65, ternyata ini adalah
tidak perlu, asalkan dummy tahun 1985 dimasukkan dalam regresi dan
log (upah) (sebagai lawan untuk upah) digunakan sebagai variabel
dependen. Menggunakan upah riil atau nominal dalam fungsi logaritmik
bentuk hanya mempengaruhi koefisien pada boneka tahun, y85. Untuk
melihat ini, misalkan P85 menunjukkan faktor deflasi untuk upah 1985
(1,65, jika kita menggunakan CPI). Kemudian, log upah riil untuk setiap
orang di i pada Sampel 1985 adalah
Kembali ke pendidikan pada tahun 1978 diperkirakan sekitar 7,5%; kembali ke pendidikan pada
tahun 1985 adalah sekitar 1,85 poin persentase lebih tinggi, atau sekitar 9,35%. Karena t statistik
pada istilah interaksi adalah 0,0185 / 0,0094 = 1,97, perbedaan pengembalian pendidikan secara
statistik signifikan pada tingkat 5% terhadap alternatif dua sisi.

Bagaimana dengan kesenjangan gender? Pada 1978, hal-hal lain dianggap setara, seorang wanita
berpenghasilan tinggi 31,7% lebih rendah dari seorang pria (27,2% adalah perkiraan yang lebih
akurat). Pada tahun 1985, kesenjangan dalam log (upah) adalah -0.317 + 0.085 = -0.232. Oleh
karena itu, kesenjangan gender tampaknya telah menurun sejak 1978 hingga 1985 olehsekitar 8,5
poin persentase. Statistik t pada istilah interaksi adalah sekitar 1,67, yang artinya adalah signifikan
pada tingkat 5% terhadap alternatif satu sisi yang positif.
a. The Chow Test for Structural Change across
Time
Contoh 13.2 menyarankan cara lain untuk menghitung uji Chow selama dua periode waktu
dengan berinteraksi masing-masing variabel dengan dummy tahun untuk satu dari dua tahun
dan pengujian untuk signifikansi bersama tahun ini dummy dan semua istilah interaksi. Karena
intersep dalam model regresi sering berubah waktu (karena, katakanlah, inflasi dalam contoh
harga perumahan), tes Chow full-blown ini dapat mendeteksi hal perubahan tersebut. Biasanya
lebih menarik untuk memungkinkan perbedaan intersepsi dan kemudian menguji apakah
koefisien slope tertentu berubah seiring waktu (seperti yang kami lakukan dalam Contoh 13.2).
Tes Chow dapat dihitung selama lebih dari dua periode waktu. Sama seperti dalam kasus dua
periode, biasanya lebih menarik untuk memungkinkan intersepsi berubah dari waktu ke waktu
dan kemudian menguji apakah koefisien slope telah berubah seiring waktu. Kita dapat menguji
keteguhan koefisien slope secara umum berinteraksi dengan semua dummy waktu-periode
(kecuali yang mendefinisikan kelompok dasar) dengan satu, beberapa, atau semua variabel
penjelas dan uji signifikansi bersama dari istilah interaksi. Untuk banyak periode waktu dan
variabel penjelas, membangun interaksi penuh bisa membosankan. Pertama, perkirakan model
terbatas dengan melakukan gabungan regresi memungkinkan intercept waktu yang berbeda; ini
memberi SSRr. Kemudian, jalankan regresi untuk masing-masing katakanlah, periode waktu T
dan dapatkan jumlah residual kuadrat untuk setiap periode waktu. Yang tidak dibatasi jumlah
residual kuadrat diperoleh sebagai SSR ur = SSR1 + SSR2 +…+ SSRT. Jika ada k variabel penjelas
(tidak termasuk intersepsi atau dummies waktu) dengan periode waktu T, maka kami menguji
batasan (T-1) k, dan ada parameter T + Tk yang diperkirakan dalam model tidak dibatasi. Jadi
jika n = n1 + n2 +…+ nT adalah jumlah total pengamatan, maka df dari uji F adalah (T-1) k dan
n - T - Tk. Kami menghitung statistik F seperti biasa: [(SSR r – SSRur ) / SSRur ] [( n – T – Tk) / (T-
1) k]. Sayangnya, seperti halnya dengan uji F berdasarkan jumlah residual kuadrat atau R-
kuadrat, tes ini tidak kuat terhadap heteroskedastisitas (termasuk perubahan varian sepanjang
waktu). Untuk mendapatkan uji heteroskedastisitas-kuat, harus membangun istilah interaksi dan
melakukan regresi gabungan.
02
Policy Analysis with Pooled
Cross Sections
(Analisis Kebijakan dengan Crossed Section)
Analisis Kebijakan dengan Crossed Section

Potongan melintang yang dikumpulkan dapat sangat berguna untuk


mengevaluasi dampak dari suatu peristiwa atau kebijakan tertentu.
Contoh studi acara berikut menunjukkan bagaimana dua set data
cross-sectional, dikumpulkan sebelum dan setelah terjadinya suatu
peristiwa, dapat digunakan untuk menentukan efek pada hasil
ekonomi.
Policy Analysis with Pooled Cross Sections
(Analisis Kebijakan dengan Crossed Section)

Contoh 13.4
Effect of Worker Compensation Laws on Weeks out of Work
(Pengaruh Undang-undang Kompensasi Pekerja pada Minggu-Minggu Kehilangan
Pekerjaan)

Meyer, Viscusi, dan Durbin (1995) (selanjutnya, MVD) mempelajari lamanya waktu (dalam beberapa
minggu) bahwa seorang pekerja yang terluka menerima kompensasi pekerja. Pada 15 Juli 1980,
Kentucky mengangkat batas atas penghasilan mingguan yang ditanggung oleh kompensasi pekerja.
Peningkatan tutup tidak berdampak pada manfaat bagi pekerja berpenghasilan rendah, tetapi
membuatnya lebih murah bagi pekerja berpenghasilan tinggi untuk tetap pada kompensasi pekerja.
Oleh karena itu, kelompok kontrol adalah pekerja berpenghasilan rendah, dan kelompok perlakuan
adalah pekerja berpenghasilan tinggi; pekerja berpenghasilan tinggi didefinisikan sebagai mereka yang
dikenai batasan perubahan pra-kebijakan. Dengan menggunakan sampel acak baik sebelum maupun
setelah perubahan kebijakan, MVD dapat menguji apakah kompensasi pekerja yang lebih dermawan
menyebabkan orang tidak lagi bekerja (semuanya tetap).
Mereka mulai dengan analisis perbedaan-dalam-perbedaan, menggunakan log (durat) sebagai
variabel dependen. Biarkan afchnge menjadi variabel dummy untuk pengamatan setelah
perubahan kebijakan dan pelajari variabel dummy untuk berpenghasilan tinggi. Menggunakan
data dalam CEDERA, persamaan estimasi, dengan kesalahan standar dalam tanda kurung,
adalah

[13.12]

Oleh karena itu , yang menyiratkan bahwa lama waktu rata-rata pada
kompensasi pekerja untuk pekerja berpenghasilan tinggi meningkat sekitar 19% karena
peningkatan tutup pendapatan. Koefisien pada afchnge kecil dan tidak signifikan secara
statistik: seperti yang diharapkan, kenaikan tutup pendapatan tidak berpengaruh pada durasi
pekerja berpenghasilan rendah.
03
Two-Period Panel Data
Analysis
(Analisis Data Panel Dua Periode)
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

 Beralih ke analisis jenis yang paling sederhana dari data panel untuk penampang individu, sekolah,
perusahaan, kota, dan yang lainnya, kami memiliki dua tahun data yaitu, = 1 dan = 2. Tahun-tahun ini
tidak perlu berdekatan, tapi = 1 berkorespondensi dengan tahun sebelumnya. Sebagai contoh, data CRIME2
memuat data tingkat kejahatan dan pengangguran di 46 kota untuk tahun 1982 dan tahun 1987. Oleh
karena itu, = 1 berkorespondensi dengan tahun 1982, dan = 2 berkorespondensi dengan tahun 1987. Jika
kita menggunakan persilangan data ( cross section) tahun 1987 dan melakukan regresi sederhana dari
crmrte dan unem maka diperoleh:

Jika ditafsirkan maka diperkirakan persamaan ini menunjukkan bahwa peningkatan tingkat pengangguran
menurunkan tingkat kejahatan. Hal ini tentunya tidak seperti apa yang diharapkan. Koefisien pada unem
tidak signifikan secara statistik pada tingkat signifikansi standar.
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

Persamaan regresi sederhana ini mungkin akan mengalami masalah variabel yang dihilangkan.
Salah satu solusi yang mungkin adalah mencoba untuk mengendalikan beberapa faktor, seperti
distribusi usia, distribusi jenis kelamin, tingkat pendidikan, upaya penegakan hukum, dan
sebagainya dalam analisis regresi berganda. Tetapi banyak faktor yang mungkin akan sulit untuk
dikontrol.

Cara alternatif untuk menggunakan data panel adalah dengan melihat faktor-faktor tidak teramati
yang mempengaruhi variabel dependen yang terdiri dari dua jenis yaitu, yang konstan dan yang
bervariasi dari waktu ke waktu. Hal tersebut dapat ditulis dengan model :
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

Pada
  model tersebut, menunjukkan orang, perusahaan, kota, dan sebagainya, dan menunjukkan
jangka waktu. Variabel 2 adalah variabel dummy yang sama dengan nol (0) ketika = 1 dan satu
(1) ketika = 2. Hal tersebut tidak berubah pada , itulah sebabnya variabel 2 tidak memiliki
subskrip . Oleh karena itu, intersep untuk = 1 adalah 0, dan intersep untuk = 2 adalah 0 + 0.
Dalam contoh, tren sekuler di Amerika Serikat akan menyebabkan tingkat kejahatan di seluruh
kota AS berubah mungkin nyata selama periode lima tahun. Variabel i menangkap semua faktor
yang tidak teramati, faktor waktu yang konstan yang mempengaruhi it. Secara generik, i disebut
unobserved effect (efek yang tidak teramati). Hal serupa juga terjadi dalam pekerjaan terapan
untuk menemukan i yang disebut sebagai fixed effect (efek tetap), yang membantu mengingat
bahwa i diperbaiki dari waktu ke waktu. Model di atas (13.13) disebut unobserved effect model
atau fixed effect model. Dalam aplikasi dapat dilihat bahwa i disebut sebagai heterogenitas yang
tidak teramati (heterogenitas individu, heterogenitas perusahaan, heterogenitas kota, dan
sebagainya).
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

Error
  it sering disebut idiosyncratic error atau time-varying error (kesalahan waktu bervariasi), karena itu
mewakili faktor yang tidak teramati yang berubah seiring waktu dan memengaruhi it.

Sebuah unobserved effect model (model efek yang tidak teramati) sederhana untuk tingkat kejahatan
kota pada tahun 1982 dan tahun 1987 adalah :

 Di mana 87 adalah variabel dummy untuk tahun 1987. Karena menunjukkan kota yang berbeda, kita
sebut i sebagai unobserved city effect (efek kota yang tidak teramati) atau a city fixed effect (efek tetap
kota), itu mewakili semua faktor yang mempengaruhi tingkat kejahatan kota yang tidak berubah dari
waktu ke waktu. Fitur geografis, seperti lokasi kota di Amerika Serikat, termasuk dalam i. Banyak faktor
lain yang mungkin tidak persis konstan, tetapi faktor tersebut kira-kira konstan selama periode lima
tahun. Ini mungkin termasuk fitur tertentu demografi penduduk (usia, ras, dan pendidikan). Kota yang
berbeda mungkin memiliki metode sendiri untuk melaporkan kejahatan, dan orang-orang yang tinggal di
kota-kota tersebut mungkin memiliki sikap yang berbeda terhadap kejahatan.
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

 Satu kemungkinan untuk memperkirakan parameter penting, 1 dengan mengingat dua tahun data panel
adalah mengumpulkan dua tahun data dan menggunakan OLS. Yang paling penting adalah agar OLS yang
dikumpulkan dapat menghasilkan estimator yang konsisten dari 1, kita harus mengasumsikan bahwa
unobserved effect (efek yang tidak teramati), i , tidak berkorelasi dengan it.

Kita dapat dengan mudah melihat ini dengan menulis (13.13) sebagai :

 di mana = i + it sering disebut composite error (kesalahan gabungan). Dari apa yang diketahui tentang
it
OLS, harus diasumsikan bahwa it berkorelasi dengan it, di mana = 1 atau 2, untuk OLS memperkirakan 1
(dan parameter lainnya secara konsisten). Hal ini berlaku bila kita menggunakan single cross section atau
two cross sections. Oleh karena itu, jika kita menganggap bahwa idiosyncratic error it berkorelasi dengan it,
OLS yang dikumpulkan bias dan tidak konsisten jika i dan it berkorelasi. Bias yang dihasilkan OLS kadang-
kadang disebut heterogenitas bias, tapi itu benar-benar hanya bias yang disebabkan dari menghilangkan
time-constant variable (variabel waktu-konstan).
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

Untuk menggambarkan apa yang terjadi, kami menggunakan data dalam CRIME2 untuk memperkirakan
(13.14) dengan menggabungkan OLS. Sejak ada 46 kota dan dua tahun untuk masing-masing kota, ada 92
total pengamatan:

Koefisien
  pada unem, meskipun positif dalam (13.16) tetapi memiliki statistik yang sangat kecil. Dengan
demikian, menggunakan OLS yang dikumpulkan pada dua tahun tidak memecahkan masalah variabel yang
dihilangkan.
Dalam sebagian besar aplikasi, alasan utama untuk mengumpulkan data panel adalah untuk memungkinkan
unobserved effect (efek yang tidak teramati), i, untuk berkorelasi dengan explanatory variables (variabel
penjelas). Lebih tepatnya dapat dituliskan :
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

Jika kita kurangi persamaan pertama dengan persamaan kedua, kita dapatkan:

atau

di
  mana Δ menunjukkan perubahan dari = 1 ke = 2.
Persamaan (13.17), yang disebut persamaan first-differenced, sangat sederhana. Ini hanya persamaan
cross-sectional, tetapi masing-masing variabel dibedakan dari waktu ke waktu. Yang paling penting dari ini
adalah bahwa Δi berkorelasi dengan Δi. Asumsi ini berlaku jika idiosnycratic error dalam , it, tidak berkorelasi
dengan explanatory variable (variabel penjelas) di kedua periode waktu.
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

Contoh 13.6
“Distributed Lag of Crime Rate on Clear-Up Rates”
Eide (1994) menggunakan data panel dari distrik kepolisian di Norwegia untuk memperkirakan lag models
terdistribusi untuk tingkat kejahatan. Variabel penjelas tunggal adalah "clear-up percentage" ( clrprc) -
persentase kejahatan yang menyebabkan hukuman. Data tingkat kejahatan berasal dari tahun 1972 dan tahun
1978. Mengikuti Eide, kami ketinggalan waktu clrprc selama satu dan dua tahun: ada kemungkinan bahwa
clear-up lalu memiliki efek jera pada tingkat kejahatan. Ini mengarah pada unobserved effects model (model
efek yang tidak teramati) untuk dua tahun:

Ketika membedakan persamaan dan memperkirakannya menggunakan data dalam CRIME3, didapatkan :
Two-Period Panel Data Analysis
(Analisis Data Panel Dua Periode)

Lanjutan

Lag kedua negatif dan signifikan secara statistik, yang menyiratkan bahwa persentase clear-up yang
lebih tinggi dua tahun lalu akan mencegah kejahatan tahun ini. Secara khusus, peningkatan 10 poin
persentase dalam clrprc dua tahun lalu akan menyebabkan penurunan 13,2% dalam tingkat kejahatan
tahun ini. Ini menunjukkan hal itu menggunakan lebih banyak sumber daya untuk menyelesaikan
kejahatan dan mendapatkan hukuman dapat mengurangi kejahatan di masa depan.
3a. Organizing Panel Data (Mengatur Data Panel)

Dalam menggunakan data panel dalam studi ekonometrika, penting untuk mengetahui bagaimana data
harus disimpan. Kita harus berhati-hati untuk mengatur data sehingga periode waktu yang berbeda untuk
unit cross-sectional yang sama (orang, perusahaan, kota, dan sebagainya) mudah dihubungkan. Untuk
konkrit, anggaplah bahwa data set di kota selama dua tahun yang berbeda. Untuk sebagian besar tujuan,
cara terbaik untuk memasukkan data adalah memiliki dua catatan untuk setiap kota dimana catatan
pertama untuk setiap kota bersesuaian dengan awal tahun, dan catatan kedua adalah untuk tahun
kemudian. Kedua catatan harus berdekatan. Oleh karena itu, satu set data untuk 100 kota dan dua tahun
akan berisi 200 catatan. Dua catatan pertama adalah untuk kota pertama dalam sampel, dua catatan
berikutnya adalah untuk kota kedua, dan seterusnya. Hal ini memudahkan untuk membangun perbedaan
untuk menyimpan ini dalam catatan kedua untuk masing-masing kota dan mengumpulkan analisis cross-
sectional yang dapat dibandingkan dengan differencing estimation (estimasi perbedaan).
3a. Organizing Panel Data (Mengatur Data Panel)

Sebagian besar dua periode data panel set yang menyertai teks ini disimpan dengan cara ini (misalnya,
CRIME2, CRIME3, GPA3, LOWBRTH, dan RENTAL). Kami menggunakan perpanjangan langsung dari
skema ini untuk set data panel dengan lebih dari dua periode waktu.

Cara kedua mengatur dua periode dari data panel adalah untuk memiliki hanya satu record per unit cross
sectional. Hal ini membutuhkan dua entri untuk setiap variabel, satu untuk setiap periode waktu. Data
panel di SLP75_81 diatur dengan cara ini. Setiap individu memiliki data pada variabel slpnap75, slpnap81,
totwrk75, totwrk81, dan sebagainya. Membuat perbedaan antara tahun 1975-1981 adalah hal mudah.
Panel data lain dengan struktur ini adalah TRAFFIC1 dan VOTE2. Namun, menempatkan data dalam satu
catatan tidak memungkinkan analisis OLS yang dikumpulkan menggunakan dua periode waktu pada data
asli. Metode ini juga tidak berfungsi untuk kumpulan data panel dengan lebih dari dua periode waktu.
04
Policy Analysis with Two-Period
Panel Data
(Analisis Kebijakan dengan Dua Periode Data
Panel)
Policy Analysis with Two-Period Panel Data
(Analisis Kebijakan dengan Dua Periode data Panel)

Panel Data set sangat berguna untuk analisis kebijakan dan, khususnya evaluasi program. Dalam
sederhana pengaturan evaluasi program, sampel individu, perusahaan, kota, dan sebagainya,
diperoleh pada periode pertama kalinya. Hal ini mirip dengan literatur percobaan alami yang dibahas
sebelumnya, dengan satu perbedaan penting: sama unit cross-sectional muncul dalam setiap periode
waktu.

Sebagai contoh, misalkan kita ingin mengevaluasi efek dari program pelatihan kerja Michigan pada
produktivitas pekerja dari perusahaan manufaktur (lihat juga Latihan Komputer C3) dalam Bab 9.
Pada scrapit menunjukkan tingkat scrap perusahaan i selama tahun t ( jumlah item per 100, yang
harus dihapus karena cacat). Membiarkan grantit menjadi indikator biner sama dengan satu jika
perusahaan i di tahun t menerima hibah pelatihan kerja.

Untuk tahun 1987 dan 1988, model ini


Policy Analysis with Two-Period Panel Data
(Analisis Kebijakan dengan Dua Periode data Panel)

Untuk tahun 1987 dan 1988, model ini

dimana y88t adalah variabel dummy untuk tahun 1988 dan α 1 adalah efek perusahaan tidak
teramati atau mengencangkan efek tetap. Efek teramati mengandung faktor-faktor seperti
kemampuan rata-rata karyawan, modal, dan keterampilan manajerial; ini kira-kira konstan selama
periode dua tahun. Dan α1 secara sistematis terkait dengan apakah perusahaan menerima hibah.
Sebenarnya, dalam program khusus ini, dana tersebut diberikan pada pertama-datang. Tapi
apakah perusahaan diterapkan pada awal untuk hibah dapat berkorelasi dengan produktivitas
pekerja. Dalam hal ini, analisis menggunakan penampang tunggal atau hanya penyatuan seorang
dari penampang akan menghasilkan bias dan estimator tidak konsisten. Persamaan untuk
menghapus α1 adalah
Policy Analysis with Two-Period Panel Data
(Analisis Kebijakan dengan Dua Periode data Panel)

 Oleh karena itu, kita hanya mundur perubahan dalam tingkat memo pada perubahan indikator hibah.
Karena tidak ada perusahaan menerima hibah pada tahun 1987, granti1 = 0 untuk semua i, dan i =
granti2 – granti1 = granti2, yang hanya menunjukkan apakah perusahaan menerima hibah pada tahun
1988. Namun, secara umum penting untuk perbedaan semua variabel (termasuk variabel dummy)
karena ini diperlukan untuk menghilangkan α 1 dalam model efek teramati (13.23).

Memperkirakan persamaan pertama-dibedakan dengan menggunakan data dalam JTRAIN memberikan


Policy Analysis with Two-Period Panel Data
(Analisis Kebijakan dengan Dua Periode data Panel)

Oleh karena itu, kami memperkirakan bahwa memiliki hibah pelatihan kerja menurunkan tingkat memo
rata-rata sebesar -.739. Tapi perkiraan secara statistik tidak berbeda dari nol. Kami mendapatkan hasil
yang lebih kuat dengan menggunakan log( scrap) dan memperkirakan efek persentase:

 Memiliki hibah pelatihan kerja diperkirakan menurunkan tingkat memo sekitar 27,2%. [Kami
memperoleh perkiraan ini dari persamaan (7.10): exp(-.317) – 1 -.272]. Untuk t statistik adalah
tentang -1.93, yang merupakan sedikit signifikan. Sebaliknya, menggunakan pooled OLS dari log ( scrap)
di y88 dan hibah memberikan 1 = .057 (standard error = .431). Dengan demikian, kita menemukan ada
hubungan yang signifikan antara tingkat memo dan hibah pelatihan kerja. Sejak berbeda ini begitu
banyak dari perkiraan pertama-perbedaan, itu menunjukkan bahwa perusahaan yang memiliki pekerja-
kemampuan yang lebih rendah lebih mungkin untuk menerima hibah.
Policy Analysis with Two-Period Panel Data
(Analisis Kebijakan dengan Dua Periode data Panel)

Hal ini berguna untuk mempelajari model evaluasi program yang lebih umum. Membiarkan yit
menunjukkan variabel hasil dan membiarkan progit menjadi variabel dummy partisipasi program. Model
efek tidak teramati paling sederhana adalah

Jika partisipasi program hanya terjadi pada periode kedua, maka OLS estimator β 1 dalam persamaan
dibedakan memiliki representasi yang sangat sederhana:

Artinya,
  kita menghitung rata-rata perubahan y selama dua periode waktu untuk pengobatan dan
kelompok kontrol. Kemudian, 1 perbedaan ini. Ini adalah versi data panel dari perbedaan-pengabaian
estimator dalam persamaan (13.11) selama dua pengumpulan perpotongan. Dengan data panel, kami
memiliki keuntungan potensial penting: kita dapat perbedaan y di waktu untuk sama unit cross-
sectional. Hal ini memungkinkan kita untuk kontrol untuk seseorang-, perusahaan-, atau efek kota-
spesifik, sebagai model di (13.25) membuat jelas.
Policy Analysis with Two-Period Panel Data
(Analisis Kebijakan dengan Dua Periode data Panel)
Contoh 13.7 Pengaruh hukum Drunk Driving tentang Lalu Lintas Kematian

Banyak negara di Amerika Serikat telah mengadopsi kebijakan yang berbeda dalam upaya untuk mengekang
mengemudi dalam keadaan mabuk. Dua jenis undang-undang yang akan kita pelajari disini adalah terbuka
kontainer laws- yang membuatnya ilegal bagi penumpang untuk memiliki wadah terbuka alkohol minuman-dan
administrasi per se laws- yang memungkinkan pengadilan untuk menangguhkan lisensi setelah sopir ditangkap
karena mengemudi dalam keadaan mabuk tapi sebelum pengemudi dihukum. Salah satu analisis yang mungkin
adalah dengan menggunakan satu bagian lintas negara untuk regresi mengemudi korban jiwa (atau yang
terkait dengan mengemudi dalam keadaan mabuk) pada indikator variabel dummy untuk apakah setiap hukum
hadir. Ini tidak mungkin untuk bekerja dengan baik karena negara memutuskan, melalui proses legislatif,
apakah mereka perlu undang-undang tersebut. Oleh karena itu, kehadiran undang-undang kemungkinan akan
terkait dengan rata-rata mabuk mengemudi korban jiwa dalam beberapa tahun terakhir. Analisis yang lebih
meyakinkan menggunakan data panel selama periode waktu di mana beberapa negara menerapkan undang-
undang baru (dan beberapa negara mungkin telah dicabut hukum yang ada). File TRAFFIC1 berisi data untuk
tahun 1985 dan 1990 untuk semua 50 negara bagian dan District of Columbia. dthrte). Pada tahun 1985, 19
negara memiliki undang-undang wadah terbuka, sementara 22 negara memiliki undang-undang tersebut pada
tahun 1990. Pada tahun 1985, 21 negara telah per se hukum; jumlah ini telah berkembang menjadi 29 pada
tahun 1990.
Policy Analysis with Two-Period Panel Data
(Analisis Kebijakan dengan Dua Periode data Panel)
Lanjutan

Menggunakan OLS setelah differencing pertama memberikan

Perkiraan menunjukkan bahwa mengadopsi hukum wadah terbuka menurunkan tingkat kematian lalu lintas
dengan 0,42, efek trivial mengingat bahwa tingkat kematian rata-rata pada tahun 1985 adalah 2,7 dengan
standar deviasi sekitar 0,6. Perkiraan tersebut secara statistik signifikan pada tingkat 5% terhadap alternatif
dua sisi.
05
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)

Untuk ilustrasi, misalkan kita memiliki N individu dan T = 3 periode waktu untuk setiap individu. Model
efek tetap umum

untuk t = 1, 2, dan 3. (Jumlah pengamatan karena itu 3 N.) Perhatikan bahwa kita sekarang termasuk
dua dummies waktu selain intercept. Ini adalah ide yang baik untuk memungkinkan intercept terpisah
untuk setiap periode waktu, terutama ketika kita memiliki sejumlah kecil dari mereka. Periode dasar,
seperti biasa, adalah t = 1. Intercept untuk periode kedua kalinya adalah δ 1 + δ2, dan seterusnya.

Asumsi utama adalah bahwa error istimewa tidak berkorelasi dengan variabel penjelas dalam setiap
periode waktu:
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)
Artinya, variabel penjelas yang ketat eksogen setelah kami mengambil efek tidak teramati, α 1. (Asumsi
exogeneity ketat dinyatakan dalam hal harapan bersyarat nol diberikan dalam lampiran bab.) Asumsi
(13.29) aturan keluar kasus di mana masa depan variabel penjelas bereaksi terhadap perubahan arus
dalam kesalahan istimewa, karena harus menjadi kasus jika x itj adalah variabel dependen tertinggal. Jika
kita telah dihilangkan variabel waktu bervariasi penting, maka (13,29) umumnya dilanggar.

Jika α1 berkorelasi dengan xitj, kemudian xitj akan berkorelasi dengan gabungan error, v it = α1 + uit,
bawah (13,29). Kami dapat menghilangkan α 1 oleh differencing periode yang berdekatan. Dalam T = 3
kasus, kita kurangi waktu satu periode dari waktu periode dua dan jangka waktu dua dari waktu
periode tiga. Hal ini memberikan

untuk t = 2 dan 3. Kami tidak memiliki persamaan dibedakan untuk t = 1 karena tidak ada yang
dikurangi dari t = 1 persamaan. Sekarang, (13.30) merupakan dua periode waktu untuk setiap individu
dalam sampel. Jika persamaan ini memenuhi asumsi model linier klasik, OLS kemudian dikumpulkan
memberikan berisi penduga, dan biasa t dan F Statistik berlaku untuk hipotesis. Kami juga dapat
menarik hasil asimtotik.
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)

Oleh karena itu, (13.30) tidak berisi intercept. Hal ini nyaman untuk tujuan tertentu, termasuk perhitungan R
kuadrat. Kecuali penyadapan waktu dalam model asli (13.28) adalah bunga langsung -mereka jarang-lebih baik
untuk memperkirakan persamaan pertama-dibedakan dengan intercept dan satu periode waktu dummy,
biasanya untuk periode ketiga. Dengan kata lain, persamaan menjadi

Perkiraan dari βj identik baik formulasi. Dengan lebih dari tiga periode waktu, hal serupa. Jika kita memiliki
yang sama T periode waktu untuk masing-masing N unit cross-sectional, kita katakan bahwa data set adalah
panel seimbang: kami memiliki periode waktu yang sama untuk semua individu, perusahaan, kota, dan
sebagainya. Kapan T relatif kecil dibandingkan N, kita harus mencakup variabel dummy untuk setiap periode
waktu untuk account untuk perubahan sekuler yang tidak dimodelkan. Oleh karena itu, setelah differencing
pertama, persamaan terlihat seperti

di mana kita memiliki T - 1 kali periode pada setiap unit i untuk persamaan pertama-dibedakan. Jumlah
pengamatan adalah N(T – 1).
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)

Contoh 13.8 Pengaruh Enterprise Zona di Klaim Pengangguran

Papke (1994) meneliti efek dari (EZ) Program zona perusahaan Indiana pada klaim pengangguran. Dia
menganalisis 22 kota di Indiana selama periode dari tahun 1980 sampai 1988. Enam zona perusahaan
yang ditunjuk pada tahun 1984, dan empat lagi ditugaskan pada tahun 1985. Dua belas dari kota dalam
sampel tidak menerima zona perusahaan selama periode ini; mereka menjabat sebagai kelompok kontrol.

Sebuah model evaluasi kebijakan sederhana adalah

dimana uclmsit adalah jumlah klaim pengangguran yang diajukan selama tahun t di kota i. parameter θt
hanya menunjukkan intercept berbeda untuk setiap periode waktu. Umumnya, klaim pengangguran jatuh
di seluruh negara bagian selama periode ini, dan ini harus tercermin dalam penyadapan tahun yang
berbeda. Variabel biner ezit sama dengan satu jika kota i pada waktu t adalah zona perusahaan; kita
tertarik di β1. Efek teramati α1 merupakan faktor tetap yang mempengaruhi iklim ekonomi di kota i. Karena
zona perusahaan penunjukan tidak ditentukan secara acak-perusahaan zona biasanya ekonomis tertekan
daerah-ada kemungkinan bahwa ezit dan α1 berkorelasi positif (tinggi α1 berarti lebih tinggi klaim
pengangguran, yang menyebabkan kesempatan yang lebih tinggi yang diberikan EZ).
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)

Lanjutan

Dengan demikian, kita harus perbedaan persamaan untuk menghilangkan α 1:

 Variabel dependen dalam persamaan ini, perubahan log (uclms it) adalah tingkat pertumbuhan tahunan
perkiraan klaim pengangguran dari tahun t - 1 untuk t. Kita bisa memperkirakan persamaan ini untuk
tahun 1981-1988 dengan menggunakan data dalam EZUNEM; ukuran sampel total 22·8 = 176. Perkiraan
β1 adalah 1 = -.182 (standard error = .078). Oleh karena itu, tampak bahwa kehadiran EZ menyebabkan
sekitar 16,6% [exp(-.182) - 1 -.166] jatuh klaim pengangguran. Ini adalah efek ekonomi yang besar dan
signifikan secara statistik.
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)

Contoh 13.9 County Kejahatan Tarif di North Carolina

Cornwell dan Trumbull (1994) menggunakan data 90 kabupaten di North Carolina, untuk tahun 1981 melalui
1987, untuk memperkirakan model efek tidak teramati kejahatan; data yang terkandung dalam CRIME4. Di
sini, kami memperkirakan versi sederhana dari model mereka, dan kami perbedaan persamaan dari waktu ke
waktu untuk menghilangkan α1, efek tidak teramati. (Cornwell dan Trumbull menggunakan transformasi yang
berbeda, yang akan kita bahas pada Bab 14.) Berbagai faktor termasuk lokasi geografis, sikap terhadap
kejahatan, catatan sejarah, dan konvensi melaporkan mungkin terkandung dalam α 1. Tingkat kejahatan jumlah
kejahatan per orang, prbarr adalah estimasi probabilitas penangkapan, prbconv adalah estimasi probabilitas
keyakinan (diberikan penangkapan), prbpris adalah probabilitas menjalani hukuman di penjara (diberikan
keyakinan), avgsen adalah rata-rata panjang kalimat disajikan, dan polpc adalah jumlah polisi per kapita.
Seperti standar dalam studi kriminometri, kami menggunakan log dari semua variabel untuk memperkirakan
elastisitas. Kami juga menyertakan set boneka tahun lengkap untuk mengontrol tren tingkat kejahatan negara
bagian. Kita dapat menggunakan tahun 1982 hingga 1987 untuk memperkirakan persamaan yang berbeda.
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)

Lanjutan

Kuantitas dalam tanda kurung adalah kesalahan standar OLS biasa; jumlah dalam tanda kurung adalah
kesalahan standar yang kuat untuk korelasi serial dan heteroskedastisitas:
Differencing with More Than Two Time Periods
(Differencing dengan Lebih Dari Dua Periode Waktu)

Lanjutan

Dalam ilustrasi, kami telah observasi data selama tiga tahun dengan sampel acak pada tahun 2000, 2002, dan
2004 dan adapun model spesifiknya
2.5a
Potential Pitfalls in First Diffrencing Panel Data
(Potensi Perangkap dalam Data Panel Perbedaan Pertama)

Di bagian ini dan sebelumnya, kami telah menyatakan bahwa membedakan data panel dari waktu ke
waktu, untuk menghilangkan efek tak teramati yang konstan waktu, adalah metode yang berharga untuk
mendapatkan efek sebab akibat. Namun demikian, membedakan tidak lepas dari kesulitan. Kami telah
membahas masalah potensial dengan metode ini ketika variabel penjelas utama tidak banyak berubah dari
waktu ke waktu (dan metode ini tidak berguna untuk variabel penjelas yang tidak pernah berubah dari
waktu ke waktu). Sayangnya, bahkan ketika kami memiliki variasi waktu yang cukup dalam x itj, estimasi
first-differenced (FD) dapat menimbulkan bias yang serius. Kami telah menyebutkan bahwa eksogenitas
yang ketat dari para regressor merupakan asumsi kritis.
Terima Kasih

CREDITS: This presentation template was created by Slidesgo, including icons by


Flaticon, and infographics & images by Freepik

Please keep this slide for attribution

Anda mungkin juga menyukai