Anda di halaman 1dari 40

EKONOMETRIKA LANJUTAN

“POOLING CROSS SECTIONS ACROSS TIME: SIMPLE PANEL DATA


METHODS”

Dosen Pengampu: Ptof. Dr. Made Suyana Utama, SE., MS

Oleh:

KELOMPOK 1

Putu Kaulika Ratu Priarsila (2207511158)

Made Hany Dwi Hapsari (2207511172)

Regina Tri Artika (2207511175)

PROGRAM STUDI EKONOMI


PEMBANGUNAN FAKULTAS EKONOMI DAN
BISNIS UNIVERSITAS UDAYANA
JIMBARAN
2023/2024
KATA PENGANTAR

Puji syukur kita panjatkan kehadapan Tuhan Yang Maha Esa karena berkat rahmatlah
kami dari Kelompok 1 yang membahas materi “POOLING CROSS SECTIONS ACROSS
TIME: SIMPLE PANEL DATA METHODS ” dapat mengerjakannya dengan lancar.

Pada makalah yang kami buat ini walaupun kami mengerjakan dengan lancar, kami
menyadari masih banyak kekurangan sehingga makalah ini belum sempurna. Maka dari itu,
kami berharap kepada pembaca untuk memberikan kritik dan saran yang membangun demi
perbaikan makalah yang akan datang.

Semoga makalah yang kami buat dapat memberi sumbangsih yang berarti bagi
pembaca karena ilmu yang didapatkan dari makalah ini.

Akhir kata, kami mohon maaf apabila ada kesalahan kata yang kami perbuat, baik
secara sengaja maupun tidak sengaja. Atas perhatiannya, kami ucapkan terima kasih.

Bukit Jimbaran, Maret 2024

Penulis

I
DAFTAR ISI

KATA PENGANTAR.............................................................................................................................i
DAFTAR ISI...........................................................................................................................................ii
BAB I PENDAHULUAN.......................................................................................................................1
1.1 Latar Belakang.............................................................................................................................1
1.2 Rumusan Masalah.......................................................................................................................2
1.3 Tujuan...........................................................................................................................................2
BAB II PEMBAHASAN........................................................................................................................3
2.1 Pooling Independent Cross Sections across Time.....................................................................4
2.1 a The Chow Test for Structural Change across Time.........................................................10
2.2 Policy Analysis with Pooled Cross Sections (Analisis Kebijakan dengan Crossed Section)
...................................................................................................................................................11
2.3 Two-Period Panel Data Analysis (Analisis Data Panel Dua Periode)...................................19
2.3 a. Organizing Panel Data (Mengatur Data Panel)...............................................................25
2.4 Analisis kebijakan dengan Dua Periode data Panel...............................................................26
2.5 Differencing dengan Lebih Dari Dua Periode Waktu............................................................30
2.5a Potensi Perangkap dalam Data Panel Perbedaan Pertama.............................................33
BAB III PENUTUP..............................................................................................................................35
3.1 Kesimpulan.................................................................................................................................35
DAFTAR PUSTAKA...........................................................................................................................36

II
BAB I

PENDAHULUAN

1.1 Latar Belakang

Dalam Chapter 13 ini, kami menunjukkan cara menerapkan beberapa regresi ke


penampang yang dikumpulan secara independen. Masalah yang diangkat sangat mirip dengan
analisis penampang standar, kecuali bahwa kita dapat mempelajari bagaimana hubungan
berubah dari waktu ke waktu dengan menyertakan variabel dummy waktu. Kami juga
menggambarkan bagaimana kumpulan data panel dapat dianalisis dalam kerangka kerja
regresi.
Sampai sekarang, kami telah membahas beberapa analisis regresi menggunakan data
seri waktu penampang murni atau murni. Meskipun kedua kasus ini sering muncul dalam
aplikasi, kumpulan data yang memiliki dimensi crosssectional dan time series digunakan
semakin sering dalam penelitian empiris. Beberapa metode regresi masih dapat digunakan
pada kumpulan data tersebut. Bahkan, data dengan aspek cross-sectional dan time series
seringkali dapat menjelaskan pertanyaan kebijakan penting. Kita akan melihat beberapa
contoh dalam bab ini.
Kami akan menganalisis dua jenis kumpulan data dalam bab ini. Penampang
yang dikumpulan secara independen diperoleh dengan mengambil sampel secara acak dari
populasi besar pada titik waktu yang berbeda (biasanya, tetapi belum tentu, tahun yang
berbeda). Misalnya, dalam setiap tahun, kita dapat menggambar sampel acak pada upah per
jam, pendidikan, pengalaman, dan sebagainya, dari populasi orang yang bekerja di Amerika
Serikat. Atau, di setiap tahun, kami menggambar sampel acak pada harga jual, rekaman
persegi, jumlah kamar mandi, dan sebagainya, rumah- rumah yang dijual di daerah
metropolitan tertentu. Dari sudut pandang statistik, kumpulan data ini memiliki fitur penting:
mereka terdiri dari pengamatan yang diambil sampel secara independen. Ini juga merupakan
aspek kunci dalam analisis data penampang kami: antara lain, ini mengesampingkan korelasi
dalam istilah kesalahan di berbagai pengamatan.
Penampang yang dikumpulan secara independen berbeda dari satu sampel acak dalam
pengambilan sampel dari populasi pada titik waktu yang berbeda kemungkinan mengarah pada
pengamatan yang tidak didistribusikan secara identik. Misalnya, distribusi upah dan
pendidikan telah berubah dari waktu ke waktu di sebagian besar negara. Seperti yang akan kita
lihat, ini mudah ditangani dalam praktiknya dengan memungkinkan penyadapan dalam model
regresi ganda, dan dalam beberapa kasus lereng, untuk berubah dari waktu ke waktu. Kami
membahas model seperti itu di Bagian 13-1. Di Bagian 13-1, kami

1
membahas bagaimana penampang pooling dari waktu ke waktu dapat digunakan untuk
mengevaluasi perubahan kebijakan.
Kumpulan data panel, sambil memiliki dimensi penampang dan rangkaian waktu,
berbeda dalam beberapa hal penting dari penampang yang dikumpulan secara independen.
Untuk mengumpulkan data panel terkadang disebut data longitudinal kami mengikuti
(atau berusaha mengikuti) individu, keluarga, perusahaan, kota, negara bagian, atau apa pun
yang sama, sepanjang waktu. Misalnya, data panel yang ditetapkan pada upah individu, jam,
pendidikan, dan faktor lainnya dikumpulkan dengan memilih orang secara acak dari populasi
pada titik waktu tertentu. Kemudian, orang- orang yang sama ini diinterview ulang pada
beberapa titik berikutnya pada waktunya. Ini memberi kita data tentang upah, jam kerja,
pendidikan, dan sebagainya, untuk kelompok orang yang sama di tahun yang berbeda.

1.2 Rumusan Masalah

Berdasarkan uraian diatas maka makalah ini secara khusus membahas materi mengenai
Pooling Cross Sections across Time: Simple Panel Data Methods.

1.3 Tujuan

Untuk memahami mengenai Pooling Cross Sections across Time: Simple Panel Data
Methods dan menyelesai tugas yang diberikan.

2
BAB II

PEMBAHASAN

Pooling Cross Sections across Time: Simple Panel Data Methods

Cross section yang dikumpulkan secara independent diperoleh dengan mengambil


sampel secara acak dari populasi besar pada titik waktu yang berbeda (biasanya, tetapi belum
tentu, tahun yang berbeda). Misalnya, di setiap tahun, kami dapat menggambar sampel acak
setiap jam upah, pendidikan, pengalaman, dan sebagainya, dari populasi orang yang bekerja di
Amerika Serikat. Atau, pada setiap tahun lai nnya, kami mengambil sampel acak pada harga
jual, ukuran persegi, jumlah kamar mandi, dan sebagainya, rumah yang dijual di daerah
metropolitan tertentu. Dari sudut pandang statistik, set data ini memiliki fitur penting: mereka
terdiri dari observasi sampel independen. Ini juga merupakan aspek kunci dalam analisis kami
data cross-sectional: antara lain, itu mengesampingkan korelasi dalam hal error di pengamatan
yang berbeda.

Cross section yang dikumpulkan secara independen berbeda dari sampel acak tunggal
dalam pengambilan sampel itu dari populasi pada titik yang berbeda dalam waktu cenderung
mengarah pada pengamatan yang tidak identik didistribusikan. Sebagai contoh, distribusi upah
dan pendidikan telah berubah dari waktu ke waktu di sebagian besar negara. Seperti yang akan
kita lihat, ini mudah untuk ditangani dalam praktik dengan memungkinkan intercept dalam
model regresi berganda, dan dalam beberapa kasus slope, berubah seiring waktu. Kami
membahas model seperti itu di Bagian 2.1. Di Bagian 2.1, kami membahas bagaimana
mengumpulkan perpotongan atau persilangan dari waktu ke waktu dapat digunakan untuk
mengevaluasi perubahan kebijakan.

Kumpulan data panel, walaupun memiliki dimensi cross-sectional dan time series,
berbeda dalam beberapa hal. hal-hal penting dari perpotongan atau persilangan yang
dikumpulkan secara independen. Untuk mengumpulkan data panel (terkadang disebut data
longitudinal) kami mengikuti (atau berupaya mengikuti) individu, keluarga, firma, kota,
negara bagian yang sama, atau apa pun, sepanjang waktu. Sebagai contoh, satu set data panel
pada upah individu, jam, pendidikan, dan faktor-faktor lain dikumpulkan dengan secara
acak

3
memilih orang-orang dari suatu populasi pada suatu titik tertentu dalam satu waktu.
Kemudian, orang-orang yang sama ini ditinjau kembali pada beb erapa titik waktu berikutnya.
Ini memberi kita data tentang upah, jam, pendidikan, dan sebagainya, untuk kelompok orang
yang sama di tahun yang berbeda.

Kumpulan data panel cukup mudah dikumpulkan untuk distrik sekolah, kota,
kabupaten, negara bagian, dan negara, dan analisis kebijakan sangat ditingkatkan dengan
menggunakan set data panel; kita akan melihat beberapa contoh didiskusi berikut. Untuk
analisis ekonometrik data panel, kami tidak dapat mengasumsikan bahwa pengamatan
didistribusikan secara independen sepanjang waktu. Misalnya, faktor yang tidak teramati
(seperti kemampuan) yang memengaruhi upah seseorang pada tahun 1990 juga akan
memengaruhi upah orang itu pada tahun 1991; faktor yang tidak teramati yang mempengaruhi
tingkat kejahatan kota pada tahun 1985 juga akan mempengaruhi tingkat kejahatan kota itu
pada tahun 1990. Karena alasan ini, model dan metode khusus telah dikembangkan untuk
menganalisis data panel. Dalam Bagian 2.3, 2.4, dan 2.5, kami menggambarkan metode
pembedaan langsung untuk menghilangkan konstanta waktu, atribut unit yang sedang
dipelajari tidak teramati. Karena metode data panel agak lebih maju, kami sebagian besar akan
mengandalkan intuisi dalam menggambarkan sifat statistik dari prosedur estimasi,
meninggalkan asumsi terperinci pada lampiran BAB. Kami mengikuti strategi yang sama di
BAB 14, yang mencakup metode data panel yang lebih rumit.

2.1 Pooling Independent Cross Sections across Time

Banyak survei individu, keluarga, dan perusahaan diulangi secara berkala, seringkali
setiap tahun. Sebuah contohnya adalah Survei Penduduk Saat Ini (CPS), yang secara acak
mengambil sampel rumah tangga setiap tahun. (Lihat, misalnya, CPS78_85, yang berisi data
dari CPS 1978 dan 1985). Jika sampel acak diambil pada setiap periode waktu,
mengumpulkan sampel acak yang dihasilkan memberi kita gabungan secara independent
persilangan.

Salah satu alasan untuk menggunakan perpotongan atau persilangan yang dikumpulkan
secara independen adalah untuk meningkatkan ukuran sampel. Dengan mengumpulkan
sampel acak yang diambil dari populasi yang sama, tetapi pada titik

4
waktu yang berbeda, kita bisa mendapatkan lebih banyak penduga yang tepat dan statistik uji
dengan kekuatan lebih besar. Pooling sangat membantu dalam hal ini hanya sejauh hubungan
antara variabel dependen dan setidaknya beberapa variabel independen tetap ada konstan
sepanjang waktu.

Seperti yang disebutkan dalam pendahuluan, menggunakan perpotongan atau


persilangan yang dikumpulkan mengumpulkan hanya komplikasi statistik kecil. Biasanya,
untuk mencerminkan fakta bahwa populasi mungkin memiliki distribusi yang berbeda pula
periode waktu, kami memungkinkan intersepsi berbeda antar periode, biasanya tahun. Ini
mudah dilakukan dengan memasukkan variabel dummy untuk semua kecuali satu tahun, di
mana tahun paling awal dalam sampel adalah biasanya dipilih sebagai tahun dasar. Mungkin
juga varians kesalahan berubah seiring waktu, sesuatu yang akan kita diskusikan nanti.

Kadang-kadang, pola koefisien pada variabel dummy tahun itu sendiri menarik.
Misalnya, seorang demografi mungkin tertarik pada pertanyaan berikut: Setelah mengontrol
pendidikan, pola kesuburan di antara wanita di atas 35 berubah antara tahun 1972 dan 1984?
Mengikuti contoh menggambarkan bagaimana pertanyaan ini dijawab dengan menggunakan
analisis regresi berganda variabel dummy tahunan.

Example 13.1 Women’s Fertility over Time

Kumpulan data dalam FERTIL1, yang mirip dengan yang digunakan oleh Sander
(1992), berasal dari National Survei Sosial Umum Pusat Penelitian Opini untuk tahun-tahun
genap 1972 hingga 1984, secara inklusif. Kami menggunakan data ini untuk memperkirakan
model yang menjelaskan jumlah total anak yang dilahirkan oleh seorang wanita (anak-anak).
Satu pertanyaan yang menarik adalah: Setelah mengendalikan faktor-faktor lain yang dapat
diamati, apa yang terjadi tingkat kesuburan dari waktu ke waktu? Faktor-faktor yang kami
kendalikan adalah tahun pendidikan, usia, ras, wilayah negara tempat tinggal pada usia 16,
dan lingkungan hidup pada usia 16 tahun. Perkiraannya diberikan pada Tabel 13.1. Tahun
dasar adalah 1972. Koefisien pada variabel dummy tahun menunjukkan penurunan tajam
dalam kesuburan pada awal 1980-an. Misalnya, koefisien pada y82 menyiratkan bahwa,
mengadakan pendidikan, usia, dan faktor-faktor lain tetap, seorang wanita rata-rata memiliki
0,5 anak lebih sedikit, atau sekitar setengah anak, pada tahun 1982 dibandingkan pada tahun
1972. Ini adalah penurunan yang sangat besar:

5
mempertahankan pendidikan, usia, dan faktor-faktor lain tetap, 100 wanita pada tahun 1982
diperkirakan memiliki sekitar 52 anak lebih sedikit dari 100 wanita yang sebanding pada tahun
1972. Karena kita mengendalikan pendidikan, penurunan ini terpisah dari penurunan
kesuburan yang disebabkan oleh peningkatan tingkat pendidikan rata-rata. (Rata-rata tahun
pendidikan adalah 12,2 untuk 1972 dan 13,3 untuk 1984.) koefisien pada y82 dan y84
mewakili penurunan kesuburan karena alasan yang tidak ditangkap dalam variabel penjelas.
Mengingat bahwa dummies tahun 1982 dan 1984 secara individual cukup signifikan, tidak
mengherankan bahwa sebagai kelompok, tahun dummies bersama-sama sangat signifikan: R-
kuadrat untuk regresi tanpa tahun dummies adalah 0,1019, dan ini mengarah ke F6,1111 = 5,87
dan p-value = 0

Wanita dengan pendidikan lebih banyak memiliki anak lebih sedikit, dan perkiraan ini
sangat signifikan secara statistik. Hal lain dianggap sama, 100 wanita
6
dengan pendidikan tinggi akan memiliki sekitar 51 anak lebih sedikit rata-rata dari 100 wanita
dengan hanya pendidikan sekolah menengah: 0.128(4) = 0.512. Usia memiliki efek yang
semakin berkurang pada kesuburan. (Titik balik dalam kuadrat adalah sekitar usia = 46, pada
saat itu paling banyak wanita telah selesai memiliki anak.)

Model yang diperkirakan pada Tabel 13.1 mengasumsikan bahwa efek dari masing-
masing variabel penjelas, khususnya pendidikan, tetap konstan. Hal ini bisa benar bisa juga
tidak.

Akhirnya, mungkin ada heteroskedastisitas dalam istilah error yang mendasari


persamaan estimasi. Ada satu perbedaan yang menarik. sekarang, varian error dapat berubah
dari waktu ke waktu bahkan jika itu tidak berubah dengan nilai- nilai pendidikan, usia, kulit
dan seterusnya. Namun demikian, eror standar heteroskedastisitas-kuat dan statistik uji valid.
Tes Breusch-Pagan akan diperoleh dengan regresi residu OLS kuadrat pada semua variabel
independen pada Tabel 13.1, termasuk tahun dummy. (Untuk kasus khusus statistik White,
nilai yang dipasang anak-anak dan nilai yang dipasang kuadrat digunakan sebagai variabel
independen, selalu.) Prosedur kuadrat terkecil tertimbang harus memperhitungkan varians
yang mungkin berubah waktu.

Example 13.2 Changes in the Return to Education and the Gender Wage Gap

Persamaan log (upah) (di mana upah adalah upah per jam) dikumpulkan selama tahun
1978 (tahun dasar) dan 1985 adalah

di mana sebagian besar variabel penjelas sekarang sudah tidak asing lagi. Serikat variabel
adalah variable dummy sama dengan satu jika orang itu milik serikat, dan nol sebaliknya.
Variabel y85 adalah dummy variabel sama dengan satu jika pengamatan berasal dari tahun
1985 dan nol jika berasal dari tahun 1978. Ada 550 orang dalam sampel pada tahun 1978 dan
satu set berbeda 534 orang pada tahun 1985.

7
Intercept untuk 1978 adalah β0, dan intersep untuk 1985 adalah β0 + δ0. Kembali ke
pendidikan di Indonesia 1978 adalah β1, dan kembali ke pendidikan pada tahun 1985 adalah
β1 + δ1. Karena itu, δ1 mengukur bagaimana kembalinya kesatu tahun lagi pendidikan setelah
berubah selama periode tujuh tahun. Akhirnya, pada tahun 1978, perbedaan log (upah) antara
perempuan dan laki-laki adalah β5; diferensial pada tahun 1985 adalah β5 + δ5. Jadi, kita bisa
menguji nol hipotesis bahwa tidak ada yang terjadi pada perbedaan gender selama periode
tujuh tahun ini dengan pengujian H0: δ5 = 0. Alternatif yang mengurangi perbedaan gender
adalah H1: δ5 > 0. Untuk kesederhanaan, kami berasumsi bahwa pengalaman dan
keanggotaan serikat memiliki efek yang sama terhadap upah di kedua waktu tersebut.

Sebelum kami menyajikan estimasi, ada satu masalah lain yang perlu kami tangani —
yaitu, setiap jam upah di sini adalah dalam dolar nominal (atau saat ini). Karena upah nominal
tumbuh hanya karena inflasi, kami benar-benar tertarik pada pengaruh masing-masing variabel
penjelas terhadap upah riil. Misalkan kita sepakat untuk mengukur upah pada tahun 1978
dolar. Ini membutuhkan upah 1985 dikurangi menjadi 1978 dolar. (Menggunakan Indeks
Harga Konsumen untuk Laporan Ekonomi Presiden 1997, faktor deflasi adalah 107.6 / 65.2
<1.65.) Meskipun kita dapat dengan mudah membagi masing-masing upah 1985 dengan 1,65,
ternyata ini adalah tidak perlu, asalkan dummy tahun 1985 dimasukkan dalam regresi dan log
(upah) (sebagai lawan untuk upah) digunakan sebagai variabel dependen. Menggunakan upah
riil atau nominal dalam fungsi logaritmik bentuk hanya mempengaruhi koefisien pada boneka
tahun, y85. Untuk melihat ini, misalkan P85 menunjukkan faktor deflasi untuk upah 1985
(1,65, jika kita menggunakan CPI). Kemudian, log upah riil untuk setiap orang di i pada
Sampel 1985 adalah

Sekarang, sementara wage1 berbeda antar orang, P85 tidak. Oleh karena itu, log (P85)
akan diserap ke dalam intersep untuk 1985. (Kesimpulan ini akan berubah jika, misalnya,
kami menggunakan indeks harga yang berbeda untuk orang yang tinggal di berbagai bagian
negara.) Intinya adalah, untuk mempelajari bagaimana

8
kembali ke pendidikan atau kesenjangan gender telah berubah, kita tidak perlu mengubah
upah nominal menjadi upah riil di Indonesia persamaan (13.1).

Jika kita lupa untuk memperbolehkan intercept yang berbeda pada tahun 1978 dan
1985, penggunaan upah nominal dapat menghasilkan hasil serius menyesatkan. Jika kita
menggunakan upah daripada log (upah) sebagai variabel dependen, itu penting untuk
menggunakan upah nyata dan untuk memasukkan dummy setahun.

Diskusi sebelumnya biasanya berlaku ketika menggunakan nilai dolar untuk dependen
atau Variabel independen. Asalkan jumlah dolar muncul dalam bentuk logaritmik dan variabel
dummy digunakan untuk semua periode waktu (kecuali, periode dasar), penggunaan deflator
harga agregat hanya akan mempengaruhi penyadapan; tak satu pun dari perkiraan slope akan
berubah.

Sekarang, kami menggunakan data dalam CPS78_85 untuk memperkirakan


persamaan:

Kembali ke pendidikan pada tahun 1978 diperkirakan sekitar 7,5%; kembali ke


pendidikan pada tahun 1985 adalah sekitar 1,85 poin persentase lebih tinggi, atau sekitar
9,35%. Karena t statistik pada istilah interaksi adalah 0,0185 / 0,0094 = 1,97, perbedaan
pengembalian pendidikan secara statistik signifikan pada tingkat 5% terhadap alternatif dua
sisi. Bagaimana dengan kesenjangan gender? Pada 1978, hal- hal lain dianggap setara, seorang
wanita berpenghasilan tinggi 31,7% lebih rendah dari seorang pria (27,2% adalah perkiraan
yang lebih akurat). Pada tahun 1985, kesenjangan dalam log (upah) adalah -0.317 + 0.085 = -
0.232. Oleh karena itu, kesenjangan gender tampaknya telah menurun sejak 1978 hingga 1985
olehsekitar 8,5 poin persentase. Statistik t pada istilah interaksi adalah sekitar 1,67, yang
artinya adalah signifikan pada tingkat 5% terhadap alternatif satu sisi yang positif.

9
Apa yang terjadi jika kita berinteraksi dengan semua variabel independen dengan
persamaan y85 (13.2)? Ini identik dengan memperkirakan dua persamaan terpisah, satu untuk
1978 dan satu untuk 1985. Kadang-kadang, ini diinginkan. Sebagai contoh, dalam Bab 7, kami
membahas studi oleh Krueger (1993), di mana ia memperkirakan kembalinya untuk
menggunakan komputer di tempat kerja. Krueger memperkirakan dua persamaan terpisah, satu
menggunakan CPS 1984 dan yang lainnya menggunakan CPS 1989. Dengan membandingkan
bagaimana kembalinya pendidikan berubah sepanjang waktu dan apakah penggunaan
komputer dikontrol atau tidak, ia memperkirakan sepertiga hingga setengahnya peningkatan
yang diamati dalam pengembalian pendidikan selama periode lima tahun dapat dikaitkan
dengan peningkatan penggunaan computer.

2.1 The Chow Test for Structural Change across Time

Dalam Bab 7, kami membahas bagaimana uji Chow — yang hanya merupakan uji F
— dapat digunakan untuk menentukan apakah fungsi regresi berganda berbeda di dua
kelompok. Kita bisa menerapkan tes itu ke dua periode waktu yang berbeda juga. Salah satu
bentuk tes memperoleh jumlah residual kuadrat dari estimasi gabungan sebagai SSR terbatas.
SSR yang tidak dibatasi adalah jumlah dari SSR untuk keduanya Diperkirakan secara terpisah
periode waktu. Mekanisme penghitungan statistik sama persis seperti sebelumnya dalam
Bagian 7-4. Versi heteroskedasticity-robust juga tersedia.

Contoh 13.2 menyarankan cara lain untuk menghitung uji Chow selama dua periode
waktu dengan berinteraksi masing-masing variabel dengan dummy tahun untuk satu dari dua
tahun dan pengujian untuk signifikansi bersama tahun ini dummy dan semua istilah interaksi.
Karena intersep dalam model regresi sering berubah waktu (karena, katakanlah, inflasi dalam
contoh harga perumahan), tes Chow full- blown ini dapat mendeteksi hal perubahan tersebut.
Biasanya lebih menarik untuk memungkinkan perbedaan intersepsi dan kemudian menguji
apakah koefisien slope tertentu berubah seiring waktu (seperti yang kami lakukan dalam
Contoh 13.2)

Tes Chow dapat dihitung selama lebih dari dua periode waktu. Sama seperti dalam
kasus dua periode, biasanya lebih menarik untuk memungkinkan intersepsi berubah dari
waktu ke waktu dan kemudian menguji apakah koefisien slope telah

10
berubah seiring waktu. Kita dapat menguji keteguhan koefisien slope secara umum
berinteraksi dengan semua dummy waktu-periode (kecuali yang mendefinisikan kelompok
dasar) dengan satu, beberapa, atau semua variabel penjelas dan uji signifikansi bersama dari
istilah interaksi. Untuk banyak periode waktu dan variabel penjelas, membangun interaksi
penuh bisa membosankan. Pertama, perkirakan model terbatas dengan melakukan gabungan
regresi memungkinkan intercept waktu yang berbeda; ini memberi SSRr. Kemudian, jalankan
regresi untuk masing-masing katakanlah, periode waktu T dan dapatkan jumlah residual
kuadrat untuk setiap periode waktu. Yang tidak dibatasi jumlah residual kuadrat diperoleh
sebagai SSRur = SSR1 + SSR2 +…+ SSRT. Jika ada k variabel penjelas (tidak termasuk
intersepsi atau dummies waktu) dengan periode waktu T, maka kami menguji batasan (T-1) k,
dan ada parameter T + Tk yang diperkirakan dalam model tidak dibatasi. Jadi jika n = n1
+ n2 +…+ nT adalah jumlah total pengamatan, maka df dari uji F adalah (T-1) k dan n - T -
Tk. Kami menghitung statistik F seperti biasa: [(SSRr – SSRur ) / SSRur ] [( n – T – Tk) / (T-1)
k]. Sayangnya, seperti halnya dengan uji F berdasarkan jumlah residual kuadrat atau R-
kuadrat, tes ini tidak kuat terhadap heteroskedastisitas (termasuk perubahan varian sepanjang
waktu). Untuk mendapatkan uji heteroskedastisitas-kuat, harus membangun istilah interaksi
dan melakukan regresi gabungan.

2.2 Policy Analysis with Pooled Cross Sections (Analisis Kebijakan dengan
Crossed Section)

Potongan melintang yang dikumpulkan dapat sangat berguna untuk mengevaluasi


dampak dari suatu peristiwa atau kebijakan tertentu. Contoh studi acara berikut menunjukkan
bagaimana dua set data cross-sectional, dikumpulkan sebelum dan setelah terjadinya suatu
peristiwa, dapat digunakan untuk menentukan efek pada hasil ekonomi.

Example 13.3 Effect of a Garbage Incinerator’s Location on Housing Prices (Pengaruh


Lokasi Insinerator Sampah terhadap Harga Rumah)

Kiel dan McClain (1995) mempelajari efek yang dimiliki insinerator sampah baru
terhadap nilai perumahan di North Andover, Massachusetts. Mereka

11
menggunakan data bertahun-tahun dan analisis ekonometrik yang cukup rumit. Kami akan
menggunakan dua tahun data dan beberapa model yang disederhanakan, tetapi analisis kami
serupa.

Desas-desus bahwa insinerator baru akan dibangun di Andover Utara dimulai setelah
tahun 1978, dan Konstruksi dimulai pada tahun 1981. Insinerator itu diharapkan akan
beroperasi segera setelah dimulainya konstruksi; insinerator sebenarnya mulai beroperasi pada
tahun 1985. Kami akan menggunakan data tentang harga rumah yang dijual pada tahun 1978
dan sampel lain dari yang dijual pada tahun 1981. Hipotesisnya adalah bahwa harga rumah
yang terletak di dekat insinerator akan turun relatif terhadap harga lebih banyak. rumah yang
jauh.

Sebagai ilustrasi, kami mendefinisikan sebuah rumah yang dekat dengan insinerator
jika jaraknya tiga mil. [Dalam Latihan Komputer C3, Anda malah diminta untuk
menggunakan jarak sebenarnya dari rumah ke insinerator, seperti dalam Kiel dan McClain
(1995).] Kita akan mulai dengan melihat efek dolar pada harga rumah. Ini mengharuskan kita
untuk mengukur harga dalam dolar konstan. Kami mengukur semua harga rumah dalam dolar
1978, menggunakan indeks harga perumahan Boston. Biarkan rprice menunjukkan harga
rumah secara riil. Seorang analis yang naif hanya akan menggunakan data tahun 1981 dan
memperkirakan model yang sangat sederhana:

rprice = γ 0 + γ 1nearinc + u [13.3]

di mana nearinc adalah variabel biner sama dengan satu jika rumah dekat insinerator, dan nol
sebaliknya. Memperkirakan persamaan ini menggunakan data dalam KIELMC memberi

= 101,307.5 – 30,688.27 nearinc [13.4]

(3,093.0) (5,827.71)

n = 142, R2 = .165.

Karena ini adalah regresi sederhana pada variabel dummy tunggal, intersep adalah
harga jual rata-rata untuk rumah tidak di dekat insinerator, dan koefisien pada hampir adalah
perbedaan dalam harga jual rata-rata antara rumah di dekat insinerator dan yang tidak.
Perkiraan menunjukkan bahwa harga jual rata-rata untuk kelompok

12
sebelumnya adalah $ 30.688,27 kurang dari untuk kelompok yang terakhir. Statistik t lebih
dari lima dalam nilai absolut, jadi kita dapat dengan kuat menolak hipotesis bahwa nilai rata-
rata untuk rumah yang dekat dan jauh dari insinerator adalah sama. Sayangnya, persamaan
(13.4) tidak menyiratkan bahwa penempatan insinerator menyebabkan nilai perumahan yang
lebih rendah. Bahkan, jika kita menjalankan regresi yang sama untuk 1978 (sebelum
insinerator bahkan dikabarkan), kita dapatkan

= 82,517.23 – 18,824.37 nearinc [13.5]

(2,653.79) (4,744.59)

n = 179, R2 = .082.

Oleh karena itu, bahkan sebelum ada pembicaraan tentang insinerator, nilai rata-rata
rumah di dekat lokasi adalah $ 18.824,37 lebih rendah dari nilai rata-rata rumah yang tidak
dekat lokasi ($ 82.517,23); perbedaannya juga signifikan secara statistik. Ini konsisten dengan
pandangan bahwa insinerator dibangun di daerah dengan nilai perumahan yang lebih rendah.
Lalu, bagaimana kita dapat mengetahui apakah membangun insinerator baru menekan nilai
perumahan? Kuncinya adalah untuk melihat bagaimana koefisien pada hampir berubah antara
1978 dan 1981. Perbedaan dalam nilai rata-rata perumahan jauh lebih besar pada tahun 1981
dibandingkan pada tahun 1978 ($ 30.688,27 dibandingkan $ 18.824,37), bahkan sebagai
persentase dari nilai rata-rata rumah tidak dekat dengan situs insinerator.
Perbedaan dalam dua koefisien pada hampir adalah

= -30,688.27 – (-18,824.37) = -11,863.9.

Ini adalah perkiraan kami tentang pengaruh insinerator pada nilai rumah di dekat lokasi
insinerator. Dalam ekonomi empiris, telah dikenal sebagai estimator perbedaan-dalam-
perbedaan karena dapat dinyatakan sebagai

[13.6]

di mana nr adalah singkatan dari “near the insinerator site” dan fr singkatan dari “farther away
from the site.” Dengan kata lain, adalah selisih waktu dalam selisih rata-rata harga rumah

di kedua lokasi. Untuk menguji apakah berbeda secara

13
statistik dari nol, kita perlu menemukan kesalahan standarnya dengan menggunakan analisis

regresi. Bahkan, dapat diperoleh dengan memperkirakan


rprice = β0 + δ Qy81 + β1nearinc + δ 1y81.nearinc + u [13.7]
Menggunakan data yang dikumpulkan selama dua tahun. Intersep, , adalah harga
rata-rata rumah yang tidak dekat dengan insinerator pada tahun 1978. Parameter
menangkap perubahan dalam semua nilai perumahan di Andover Utara dari 1978 hingga 1981.
[Perbandingan persamaan (13.4) dan (13.5) menunjukkan bahwa nilai perumahan di North
Andover, relatif terhadap indeks harga perumahan Boston,

meningkat tajam selama periode ini.] Koefisien pada nearinc, , mengukur lokasi efek yang
tidak disebabkan oleh keberadaan insinerator: seperti yang kita lihat dalam persamaan (13.5),
bahkan pada tahun 1978, rumah di dekat lokasi insinerator dijual dengan harga kurang dari
rumah yang lebih jauh dari lokasi.

Parameter yang menarik adalah pada jangka waktu interaksi y81 · hampir: d1
mengukur penurunan nilai perumahan akibat insinerator baru, asalkan kami berasumsi bahwa
rumah yang dekat dan jauh dari lokasi tidak menghargai pada tingkat yang berbeda karena
alasan lain. Estimasi persamaan (13.7) diberikan pada kolom (1) dari Tabel 13.2. Satu-satunya
angka yang tidak dapat kita peroleh dari persamaan (13.4) dan (13.5) adalah kesalahan standar
. Statistik t pada adalah sekitar 21.59, yang sedikit signifikan terhadap alternatif 1p-
sisi satu sisi < .0572. Kiel dan McClain (1995) memasukkan berbagai karakteristik perumahan
dalam analisis penentuan tapak insinerator. Ada dua alasan bagus untuk melakukan ini.
Pertama, jenis rumah yang dijual di dekat insinerator pada tahun 1981 mungkin secara
sistematis berbeda dengan
yang dijual di dekat insinerator pada tahun 1978; jika demikian, penting untuk mengendalikan
karakteristik tersebut. Kedua, bahkan jika karakteristik rumah yang relevan tidak berubah,
termasuk mereka dapat sangat mengurangi varians kesalahan, yang kemudian dapat
mengecilkan kesalahan standar . (Lihat Bagian 6-3 untuk diskusi.) Dalam kolom (2), kami
kontrol untuk umur rumah, menggunakan kuadratik. Ini secara substansial meningkatkan R-
squared (dengan mengurangi varians residual). Koefisien pada y81 · nearinc sekarang
besarnya jauh lebih besar, dan kesalahan standarnya lebih rendah.

Selain variabel umur dalam kolom (2), kolom (3) mengontrol jarak ke jalan kaki
(intstate), luas tanah di kaki (tanah), luas rumah di kaki (area), jumlah kamar

14
(kamar) , dan jumlah pemandian (baths). Ini menghasilkan perkiraan pada y81 · mendekati
mendekati tanpa kontrol, tetapi menghasilkan kesalahan standar yang jauh lebih kecil:
statistik t untuk adalah sekitar 22,84. Oleh karena itu, kami menemukan efek yang jauh
lebih signifikan di kolom (3) daripada di kolom (1). Kolom (3) perkiraan lebih disukai karena
mereka mengendalikan sebagian besar faktor dan memiliki kesalahan standar terkecil (kecuali
dalam konstanta, yang tidak penting di sini). Fakta bahwa nearinc memiliki koefisien yang
jauh lebih kecil dan tidak signifikan pada kolom (3) menunjukkan bahwa karakteristik yang
termasuk dalam kolom (3) sebagian besar menangkap karakteristik perumahan yang paling
penting untuk menentukan harga rumah.

Untuk tujuan memperkenalkan metode ini, kami menggunakan tingkat harga


perumahan nyata pada Tabel 13.2. Lebih masuk akal untuk menggunakan log (harga) [atau log
(rprice)] dalam analisis untuk mendapatkan efek persentase perkiraan.
Model dasar menjadi

log(price) = β0 + δ 0y81 + β1nearinc +δ 1y81.nearinc + u [13.8]

15
Sekarang, 100 # adalah perkiraan persentase penurunan nilai perumahan karena
insinerator. [Seperti dalam Contoh 13.2, menggunakan log (harga) versus log (rprice) hanya
memengaruhi koefisien pada y81.] Menggunakan 321 observasi yang sama memberikan

[13.9]

Koefisien pada istilah interaksi menyiratkan bahwa, karena insinerator baru, rumah-
rumah di dekat insinerator kehilangan nilai sekitar 6,3%. Namun, perkiraan ini tidak berbeda
secara statistik dari nol. Tetapi ketika kita menggunakan satu set kontrol penuh, seperti pada
kolom (3) dari Tabel 13.2 (tetapi dengan intst, tanah, dan area muncul dalam bentuk
logaritmik), koefisien pada y81 · nearinc menjadi 2.132 dengan statistik t sekitar 22.53. Sekali
lagi, mengendalikan faktor-faktor lain ternyata penting. Menggunakan bentuk logaritmik,
kami memperkirakan bahwa rumah-rumah di dekat insinerator didevaluasi sekitar 13,2%.

Metodologi yang digunakan dalam contoh sebelumnya memiliki banyak aplikasi,


terutama ketika data muncul dari eksperimen alami (atau eksperimen semu). Eksperimen alami
terjadi ketika beberapa peristiwa eksogen, sering kali merupakan perubahan dalam kebijakan
pemerintah mengubah lingkungan tempat individu, keluarga, perusahaan, atau kota beroperasi.
Eksperimen alami selalu memiliki kelompok kontrol, yang tidak terpengaruh oleh perubahan
kebijakan, dan kelompok perlakuan, yang dianggap dipengaruhi oleh perubahan kebijakan.
Tidak seperti eksperimen sejati, di mana kelompok perlakuan dan kontrol dipilih secara acak
dan eksplisit, kelompok kontrol dan perlakuan dalam eksperimen alami muncul dari
perubahan kebijakan tertentu. Untuk mengendalikan perbedaan sistematis antara kelompok
kontrol dan kelompok perlakuan, kami membutuhkan dua tahun data, satu sebelum perubahan
kebijakan dan satu setelah perubahan. Dengan demikian, sampel kami bermanfaat dibagi
menjadi empat kelompok: kelompok kontrol sebelum perubahan, kelompok kontrol setelah
perubahan, kelompok perlakuan sebelum perubahan, dan kelompok perlakuan setelah
perubahan. Panggil C kelompok kontrol dan T kelompok perlakuan, biarkan dT sama dengan
kesatuan untuk kelompok

16
perlakuan T, dan nol sebaliknya. Kemudian, membiarkan d2 menunjukkan variabel dummy
untuk periode waktu kedua (perubahan postpolicy), persamaan bunga adalah

y = β0 + δ 0d2 + β1dT + δ 1d2.dT + other factors [13.10]

di mana y adalah variabel hasil yang menarik. Seperti dalam Contoh 13.3, mengukur
dampak kebijakan. Tanpa faktor-faktor lain dalam regresi, akan menjadi penaksir
perbedaan-dalam-perbedaan:

[13.11]

di mana bilah menunjukkan rata-rata, subskrip pertama menunjukkan tahun, dan subskrip
kedua menunjukkan grup. Pengaturan umum perbedaan-perbedaan ditunjukkan pada Tabel
13.3. Tabel 13.3 menunjukkan bahwa parameter , kadang- kadang disebut efek perlakuan
rata-rata (karena mengukur efek "perlakuan" atau kebijakan terhadap hasil rata-rata y), dapat
diperkirakan dengan dua cara: (1) Hitung perbedaan dalam rata-rata antara kelompok
perlakuan dan kontrol dalam setiap periode waktu, dan kemudian bedakan hasilnya dari
waktu ke waktu; ini seperti dalam persamaan (13.11); (2) Hitung perubahan rata-rata dari
waktu ke waktu untuk masing- masing kelompok perlakuan dan kontrol, dan kemudian
bedakan perubahan ini, yang

berarti kita cukup menuliskan . Secara alami, estimasi


tidak tergantung pada bagaimana kita melakukan pembedaan, seperti yang terlihat oleh
penataan ulang sederhana.

Ketika variabel penjelas ditambahkan ke persamaan (13.10) (untuk mengontrol fakta bahwa
populasi sampel dapat berbeda secara sistematis selama dua periode), estimasi OLS untuk
tidak lagi memiliki bentuk sederhana (13,11), tetapi interpretasinya serupa.

17
Example 13.4 Effect of Worker Compensation Laws on Weeks out of Work (Pengaruh
Undang-undang Kompensasi Pekerja pada Minggu-Minggu Kehilangan Pekerjaan)

Meyer, Viscusi, dan Durbin (1995) (selanjutnya, MVD) mempelajari lamanya waktu
(dalam beberapa minggu) bahwa seorang pekerja yang terluka menerima kompensasi pekerja.
Pada 15 Juli 1980, Kentucky mengangkat batas atas penghasilan mingguan yang ditanggung
oleh kompensasi pekerja. Peningkatan tutup tidak berdampak pada manfaat bagi pekerja
berpenghasilan rendah, tetapi membuatnya lebih murah bagi pekerja berpenghasilan tinggi
untuk tetap pada kompensasi pekerja. Oleh karena itu, kelompok kontrol adalah pekerja
berpenghasilan rendah, dan kelompok perlakuan adalah pekerja berpenghasilan tinggi; pekerja
berpenghasilan tinggi didefinisikan sebagai mereka yang dikenai batasan perubahan pra-
kebijakan. Dengan menggunakan sampel acak baik sebelum maupun setelah perubahan
kebijakan, MVD dapat menguji apakah kompensasi pekerja yang lebih dermawan
menyebabkan orang tidak lagi bekerja (semuanya tetap). Mereka mulai dengan analisis
perbedaan-dalam- perbedaan, menggunakan log (durat) sebagai variabel dependen. Biarkan
afchnge menjadi variabel dummy untuk pengamatan setelah perubahan kebijakan dan pelajari
variabel dummy untuk berpenghasilan tinggi. Menggunakan data dalam CEDERA, persamaan
estimasi, dengan kesalahan standar dalam tanda kurung, adalah

[13.12]

Oleh karena itu, , yang menyiratkan bahwa lama waktu rata- rata
pada kompensasi pekerja untuk pekerja berpenghasilan tinggi meningkat sekitar 19% karena
peningkatan tutup pendapatan. Koefisien pada afchnge kecil dan tidak signifikan secara
statistik: seperti yang diharapkan, kenaikan tutup pendapatan tidak berpengaruh pada durasi
pekerja berpenghasilan rendah.

Ini adalah contoh yang baik tentang bagaimana kita bisa mendapatkan perkiraan yang
cukup tepat tentang dampak perubahan kebijakan meskipun kita tidak bisa menjelaskan
banyak variasi dalam variabel dependen. Variabel dummy dalam (13.12) hanya menjelaskan
2.1% dari variasi dalam log (durat). Ini masuk akal: jelas

18
ada banyak faktor, termasuk parahnya cedera, yang memengaruhi berapa lama seseorang
menerima kompensasi pekerja. Untungnya, kami memiliki ukuran sampel yang sangat besar,
dan ini memungkinkan kami untuk mendapatkan statistik t yang signifikan. MVD juga
menambahkan berbagai kontrol untuk jenis kelamin, status perkawinan, usia, industri, dan
jenis cedera. Hal ini memungkinkan fakta bahwa jenis orang dan jenis cedera mungkin
berbeda secara sistematis dengan kelompok pendapatan selama dua tahun. Mengontrol faktor-
faktor ini ternyata tidak banyak berpengaruh pada perkiraan . (Lihat Latihan Komputer
C4.)

Kadang-kadang, kedua kelompok terdiri dari orang-orang yang tinggal di dua negara
tetangga di Amerika Serikat. Misalnya, untuk menilai dampak perubahan pajak rokok pada
konsumsi rokok, kita dapat memperoleh sampel acak dari dua negara bagian selama dua
tahun. Di Negara A, kelompok kontrol, tidak ada perubahan dalam pajak rokok. Di Negara B,
kelompok perlakuan, pajak meningkat (atau menurun) antara dua tahun. Variabel hasil akan
menjadi ukuran konsumsi rokok, dan persamaan (13.10) dapat diperkirakan untuk menentukan
pengaruh pajak terhadap konsumsi rokok. Untuk survei yang menarik tentang metodologi
eksperimen alami dan beberapa contoh tambahan, lihat Meyer (1995).

2.3 Two-Period Panel Data Analysis (Analisis Data Panel Dua Periode)

Beralih ke analisis jenis yang paling sederhana dari data panel untuk penampang
individu, sekolah, perusahaan, kota, dan yang lainnya, kami memiliki dua tahun data yaitu, t =
1 dan t = 2. Tahun-tahun ini tidak perlu berdekatan, tapi t = 1 berkorespondensi dengan tahun
sebelumnya. Sebagai contoh, data CRIME2 memuat data tingkat kejahatan dan pengangguran
di 46 kota untuk tahun 1982 dan tahun 1987. Oleh karena itu, t = 1 berkorespondensi dengan
tahun 1982, dan t = 2 berkorespondensi dengan tahun 1987. Jika kita menggunakan
persilangan data (cross section) tahun 1987 dan melakukan regresi sederhana dari crmrte dan
unem maka diperoleh :

19
Jika ditafsirkan maka diperkirakan persamaan ini menunjukkan bahwa peningkatan
tingkat pengangguran menurunkan tingkat kejahatan. Hal ini tentunya tidak seperti apa yang
diharapkan. Koefisien pada unem tidak signifikan secara statistik pada tingkat signifikansi
standar.

Persamaan regresi sederhana ini mungkin akan mengalami masalah variabel yang
dihilangkan. Salah satu solusi yang mungkin adalah mencoba untuk mengendalikan beberapa
faktor, seperti distribusi usia, distribusi jenis kelamin, tingkat pendidikan, upaya penegakan
hukum, dan sebagainya dalam analisis regresi berganda. Tetapi banyak faktor yang mungkin
akan sulit untuk dikontrol.

Cara alternatif untuk menggunakan data panel adalah dengan melihat faktor- faktor
tidak teramati yang mempengaruhi variabel dependen yang terdiri dari dua jenis yaitu, yang
konstan dan yang bervariasi dari waktu ke waktu. Hal tersebut dapat ditulis dengan model :

Pada model di atas, i menunjukkan orang, perusahaan, kota, dan sebagainya, dan t
menunjukkan jangka waktu. Variabel δ 2 adalah variabel dummy yang sama dengan nol (0)
ketika t = 1 dan satu (1) ketika t = 2. Hal tersebut tidak berubah pada i, itulah sebabnya
variabel δ 2 tidak memiliki subskrip i. Oleh karena itu, intersep untuk t = 1 adalah β0, dan
intersep untuk t = 2 adalah β0 + δ 0. Dalam contoh, tren sekuler di Amerika Serikat akan
menyebabkan tingkat kejahatan di seluruh kota AS berubah mungkin nyata selama periode
lima tahun. Variabel α i menangkap semua faktor yang tidak teramati, faktor waktu yang
konstan yang mempengaruhi γ it. Secara generik, α i disebut unobserved effect (efek yang
tidak teramati). Hal serupa juga terjadi dalam pekerjaan terapan untuk menemukan α i yang
disebut sebagai fixed effect (efek tetap), yang membantu mengingat bahwa α i diperbaiki dari
waktu ke waktu. Model di atas (13.13) disebut unobserved effect model atau fixed effect model.
Dalam aplikasi dapat dilihat bahwa α i disebut sebagai heterogenitas yang tidak teramati
(heterogenitas individu, heterogenitas perusahaan, heterogenitas kota, dan sebagainya).

20
Error U it sering disebut idiosyncratic error atau time-varying error (kesalahan waktu
bervariasi), karena itu mewakili faktor yang tidak teramati yang berubah seiring waktu dan
memengaruhi γ it.

Sebuah unobserved effect model (model efek yang tidak teramati) sederhana untuk
tingkat kejahatan kota pada tahun 1982 dan tahun 1987 adalah :

Di mana δ 87 adalah variabel dummy untuk tahun 1987. Karena i menunjukkan kota
yang berbeda, kita sebut α i sebagai unobserved city effect (efek kota yang tidak teramati) atau
a city fixed effect (efek tetap kota), itu mewakili semua faktor yang mempengaruhi tingkat
kejahatan kota yang tidak berubah dari waktu ke waktu. Fitur geografis, seperti lokasi kota di
Amerika Serikat, termasuk dalam α i. Banyak faktor lain yang mungkin tidak persis konstan,
tetapi faktor tersebut kira-kira konstan selama periode lima tahun. Ini mungkin termasuk fitur
tertentu demografi penduduk (usia, ras, dan pendidikan). Kota yang berbeda mungkin
memiliki metode sendiri untuk melaporkan kejahatan, dan orang-orang yang tinggal di kota-
kota tersebut mungkin memiliki sikap yang berbeda terhadap kejahatan.

Satu kemungkinan untuk memperkirakan parameter penting, β1 dengan mengingat dua


tahun data panel adalah mengumpulkan dua tahun data dan menggunakan OLS. Yang paling
penting adalah agar OLS yang dikumpulkan dapat menghasilkan estimator yang konsisten dari
β1, kita harus mengasumsikan bahwa unobserved effect (efek yang tidak teramati), α i , tidak
berkorelasi dengan χit.

Kita dapat dengan mudah melihat ini dengan menulis (13.13) sebagai :

di mana V it = α i + U it sering disebut composite error (kesalahan gabungan). Dari apa yang
diketahui tentang OLS, harus diasumsikan bahwa V it berkorelasi dengan χit, di mana t = 1
atau 2, untuk OLS memperkirakan β1 (dan parameter lainnya secara konsisten). Hal ini
berlaku bila kita menggunakan single cross section atau two cross sections. Oleh karena itu,
jika kita menganggap bahwa idiosyncratic error U it berkorelasi dengan χit, OLS yang
dikumpulkan bias dan tidak konsisten jika α i dan χit

21
berkorelasi. Bias yang dihasilkan OLS kadang-kadang disebut heterogenitas bias, tapi itu
benar-benar hanya bias yang disebabkan dari menghilangkan time-constant variable (variabel
waktu-konstan). Untuk menggambarkan apa yang terjadi, kami menggunakan data dalam
CRIME2 untuk memperkirakan (13.14) dengan menggabungkan OLS. Sejak ada 46 kota dan
dua tahun untuk masing-masing kota, ada 92 total pengamatan:

Koefisien pada unem, meskipun positif dalam (13.16) tetapi memiliki t statistik yang
sangat kecil. Dengan demikian, menggunakan OLS yang dikumpulkan pada dua tahun tidak
memecahkan masalah variabel yang dihilangkan.

Dalam sebagian besar aplikasi, alasan utama untuk mengumpulkan data panel adalah
untuk memungkinkan unobserved effect (efek yang tidak teramati), α i, untuk berkorelasi
dengan explanatory variables (variabel penjelas). Lebih tepatnya dapat dituliskan :

Jika kita kurangi persamaan pertama dengan persamaan kedua, kita dapatkan :

atau

di mana Δ menunjukkan perubahan dari t = 1 ke t = 2.

Persamaan (13.17), yang disebut persamaan first-differenced, sangat sederhana. Ini


hanya persamaan cross-sectional, tetapi masing-masing variabel dibedakan dari waktu ke
waktu. Yang paling penting dari ini adalah bahwa ΔU i

22
berkorelasi dengan Δ χi. Asumsi ini berlaku jika idiosnycratic error dalam t, U it, tidak
berkorelasi dengan explanatory variable (variabel penjelas) di kedua periode waktu.

Sebagai contoh, anggaplah upaya penegakan hukum meningkat lebih banyak di kota-
kota di mana tingkat pengangguran menurun. Hal ini dapat menyebabkan korelasi negatif
antara ΔU i dan Δunemi, yang kemudian akan menyebabkan bias dalam estimator OLS .
Tentu, masalah ini dapat diatasi sampai batas tertentu dengan memasukkan lebih banyak
faktor dalam persamaan.

Satu-satunya asumsi lain yang berlaku untuk OLS statistik biasa adalah bahwa (13.17)
memenuhi asumsi homoskedastisitas. Ketika kami memperkirakan (13.17) untuk contoh
tingkat kejahatan, kami dapatkan :

yang sekarang
memberikan
hubungan positif dan signifikan secara statistik antara kejahatan dan pengangguran.

Sedikit variasi dalam Δ χi dapat menyebabkan large standard error untuk β1 ketika
memperkirakan (13.17) dari OLS. Kita dapat memerangi ini dengan menggunakan large cross
section. Selain itu kita dapat menggunakan perubahan dari waktu ke waktu yang kadang lebih
baik daripada menggunakan perubahan dari tahun- ke-tahun.

Sebagai contoh, mempertimbangkan masalah kembali ke pendidikan menggunakan


data panel pada individu selama dua tahun. Model yang di dapat adalah:

di mana α i mengandung unobserved ability (kemampuan yang tidak teramati) yang mungkin
berkorelasi dengan educit (pendidikan). Persamaan dalam perbedaan pertama adalah :

23
kita dapat memperkirakan ini dengan OLS. Masalahnya adalah kita tertarik pada orang
dewasa yang bekerja, dan menurut sebagian besar individu yang dipekerjakan pendidikan tidak
berubah seiring waktu. Jika hanya sebagian kecil dari sampel Δ educi berbeda dari nol, akan
sulit untuk mendapatkan estimator tepat β1 dari (13.19), kecuali kita memiliki ukuran sampel
yang agak besar. Secara teori, menggunakan persamaan first-differenced untuk
memperkirakan masalah kembali ke pendidikan adalah ide yang bagus, tetapi tidak bekerja
dengan baik untuk sebagian besar set data panel yang tersedia saat ini.

Menambahkan beberapa variabel penjelas tidak menyebabkan kesulitan. Kita mulai


dengan unobserved effects model (model efek yang tidak teramati) :

untuk t = 1 dan 2. Persamaan ini terlihat lebih rumit karena masing-masing variabel penjelas
memiliki tiga subskrip. Yang pertama menunjukkan nomor pengamatan cross-sectional, yang
kedua menunjukkan periode waktu, dan yang ketiga hanyalah label variabel.

CONTOH 13.5 "Sleeping versus Working"

Kami menggunakan dua tahun data panel di SLP75_81, dari Biddle dan Hamermesh
(1990), untuk memperkirakan tradeoff antara tidur dan bekerja. Pada masalah 3 dalam Bab 3,
kami hanya menggunakan cross-section (persilangan data) tahun 1975. Kumpulan data panel
yang ditetapkan untuk tahun 1975 dan tahun 1981 memiliki 239 orang, yang jauh lebih kecil
dari tahun 1975 yang mencakup lebih dari 700 orang. Unobserved effects model (model efek
yang tidak teramati) untuk total menit tidur per minggu adalah :

Unobserved effects (efek yang tidak teramati), α i, akan disebut unobserved individual effect
atau an individual fixed effect. Sangat penting untuk memungkinkan α i dikorelasikan dengan
totwrkitit. Beberapa orang mempunyai lebih banyak energi, ini menyebabkan mereka kurang
tidur dan lebih banyak bekerja. Variabel educ adalah pendidikan, marr adalah variabel
dummy pernikahan, yngkid adalah variabel dummy

24
yang menunjukkan adanya anak kecil, dan gdhlth adalah variabel dummy kesehatan. Dari
perbedaan tersebut di dapat persamaan :

Dengan asumsi bahwa idiosyncratic error, ΔU i, tidak berkorelasi dengan perubahan dalam
semua variabel penjelas, kita bisa mendapatkan estimator yang konsisten menggunakan OLS.
Hal ini memberikan :

Koefisien pada Δtotwrk menunjukkan tradeoff antara tidur dan bekerja dengan faktor-
faktor lain tetap, satu jam pekerjaan dikaitkan dengan 0,227(60) = 13,62 lebih sedikit menit
tidur.t statistik (−6,31) sangat signifikan. Tidak ada perkiraan lain, kecuali intersep yang
berbeda secara statistik dari nol. Uji F untuk signifikansi dari semua variabel kecuali Δtotwrk
memberikan p-value = 49, yang berarti secara serentak tidak signifikan.

Kesalahan standar pada Δeduc relatif besar terhadap perkiraan. Ini adalah fenomena
yang dijelaskan sebelumnya untuk persamaan upah. Dalam sampel 239 orang, 76,6% (183
orang) tidak memiliki perubahan pendidikan selama periode enam tahun, dan 90% orang
memiliki perubahan dalam pendidikan paling banyak satu tahun.

Data panel juga dapat digunakan untuk memperkirakan lag models terdistribusi.
Bahkan jika kita menentukan persamaannya untuk dua tahun, kita perlu mengumpulkan lebih
banyak tahun data untuk mendapatkan explanatory variable (variabel penjelas). Berikut ini
adalah contoh sederhana:

CONTOH 13.6 "Distributed Lag of Crime Rate on Clear-Up Rates"

Eide (1994) menggunakan data panel dari distrik kepolisian di Norwegia untuk
memperkirakan lag models terdistribusi untuk tingkat kejahatan. Variabel penjelas

25
tunggal adalah "clear-up percentage" (clrprc) - persentase kejahatan yang menyebabkan
hukuman. Data tingkat kejahatan berasal dari tahun 1972 dan tahun 1978. Mengikuti Eide,
kami ketinggalan waktu clrprc selama satu dan dua tahun: ada kemungkinan bahwa clear-up
lalu memiliki efek jera pada tingkat kejahatan. Ini mengarah pada unobserved effects model
(model efek yang tidak teramati) untuk dua tahun :

Ketika membedakan persamaan dan memperkirakannya menggunakan data dalam


CRIME3, didapatkan :

Lag kedua negatif dan signifikan secara statistik, yang menyiratkan bahwa persentase
clear-up yang lebih tinggi dua tahun lalu akan mencegah kejahatan tahun ini. Secara khusus,
peningkatan 10 poin persentase dalam clrprc dua tahun lalu akan menyebabkan penurunan
13,2% dalam tingkat kejahatan tahun ini. Ini menunjukkan hal itu menggunakan lebih banyak
sumber daya untuk menyelesaikan kejahatan dan mendapatkan hukuman dapat mengurangi
kejahatan di masa depan.

2.3 a. Organizing Panel Data (Mengatur Data Panel)


Dalam menggunakan data panel dalam studi ekonometrika, penting untuk mengetahui
bagaimana data harus disimpan. Kita harus berhati-hati untuk mengatur data sehingga periode
waktu yang berbeda untuk unit cross-sectional yang sama (orang, perusahaan, kota, dan
sebagainya) mudah dihubungkan. Untuk konkrit, anggaplah bahwa data set di kota selama dua
tahun yang berbeda. Untuk sebagian besar tujuan, cara terbaik untuk memasukkan data adalah
memiliki dua catatan untuk setiap kota dimana catatan pertama untuk setiap kota bersesuaian
dengan awal tahun, dan catatan kedua adalah untuk tahun kemudian. Kedua catatan harus
berdekatan. Oleh karena itu, satu set data untuk 100 kota dan dua tahun akan berisi 200
catatan. Dua catatan pertama adalah untuk kota pertama dalam sampel, dua catatan berikutnya
adalah untuk kota kedua, dan seterusnya. Hal ini memudahkan untuk membangun

26
perbedaan untuk menyimpan ini dalam catatan kedua untuk masing-masing kota dan
mengumpulkan analisis cross-sectional yang dapat dibandingkan dengan differencing
estimation (estimasi perbedaan).

Sebagian besar dua periode data panel set yang menyertai teks ini disimpan dengan
cara ini (misalnya, CRIME2, CRIME3, GPA3, LOWBRTH, dan RENTAL).

Kami menggunakan perpanjangan langsung dari skema ini untuk set data panel dengan lebih
dari dua periode waktu.

Cara kedua mengatur dua periode dari data panel adalah untuk memiliki hanya satu
record per unit cross sectional. Hal ini membutuhkan dua entri untuk setiap variabel, satu
untuk setiap periode waktu. Data panel di SLP75_81 diatur dengan cara ini. Setiap individu
memiliki data pada variabel slpnap75, slpnap81, totwrk75, totwrk81, dan sebagainya.
Membuat perbedaan antara tahun 1975-1981 adalah hal mudah. Panel data lain dengan
struktur ini adalah TRAFFIC1 dan VOTE2. Namun, menempatkan data dalam satu catatan
tidak memungkinkan analisis OLS yang dikumpulkan menggunakan dua periode waktu pada
data asli. Metode ini juga tidak berfungsi untuk kumpulan data panel dengan lebih dari dua
periode waktu.

2.4 Analisis kebijakan dengan Dua Periode data Panel

Panel Data set sangat berguna untuk analisis kebijakan dan, khususnya evaluasi
program. Dalam sederhana pengaturan evaluasi program, sampel individu, perusahaan, kota,
dan sebagainya, diperoleh pada periode pertama kalinya. Hal ini mirip dengan literatur
percobaan alami yang dibahas sebelumnya, dengan satu perbedaan penting: sama unit cross-
sectional muncul dalam setiap periode waktu.

Sebagai contoh, misalkan kita ingin mengevaluasi efek dari program pelatihan kerja
Michigan pada produktivitas pekerja dari perusahaan manufaktur (lihat juga Latihan Komputer
C3) dalam Bab 9. Pada scrapit menunjukkan tingkat scrap perusahaan i selama tahun t (
jumlah item per 100, yang harus dihapus karena cacat).

27
Membiarkan grantit menjadi indikator biner sama dengan satu jika perusahaan i di tahun t
menerima hibah pelatihan kerja. Untuk tahun 1987 dan 1988, model ini

dimana y88t adalah variabel dummy untuk tahun 1988 dan α 1 adalah efek perusahaan tidak
teramati atau mengencangkan efek tetap. Efek teramati mengandung faktor- faktor seperti
kemampuan rata-rata karyawan, modal, dan keterampilan manajerial; ini kira-kira konstan
selama periode dua tahun. Dan α1 secara sistematis terkait dengan apakah perusahaan
menerima hibah. Sebenarnya, dalam program khusus ini, dana tersebut diberikan pada
pertama-datang. Tapi apakah perusahaan diterapkan pada awal untuk hibah dapat berkorelasi
dengan produktivitas pekerja. Dalam hal ini, analisis menggunakan penampang tunggal atau
hanya penyatuan seorang dari penampang akan menghasilkan bias dan estimator tidak
konsisten.

Persamaan untuk menghapus α1 adalah

Oleh karena itu, kita hanya mundur perubahan dalam tingkat memo pada perubahan
indikator hibah. Karena tidak ada perusahaan menerima hibah pada tahun 1987, granti1 = 0
untuk semua i, dan ∆ granti = granti2 – granti1 = granti2, yang hanya menunjukkan apakah
perusahaan menerima hibah pada tahun 1988. Namun, secara

umum penting untuk perbedaan semua variabel (termasuk variabel dummy) karena ini
diperlukan untuk menghilangkan α1 dalam model efek teramati (13.23).

Memperkirakan persamaan pertama-dibedakan dengan menggunakan data dalam


JTRAIN memberikan

28
Oleh karena itu, kami memperkirakan bahwa memiliki hibah pelatihan kerja menurunkan
tingkat memo rata-rata sebesar -.739. Tapi perkiraan secara statistik tidak berbeda dari nol.
Kami mendapatkan hasil yang lebih kuat dengan menggunakan log(scrap) dan
memperkirakan efek persentase:

Memiliki hibah pelatihan kerja diperkirakan menurunkan tingkat memo sekitar 27,2%. [Kami
memperoleh perkiraan ini dari persamaan (7.10): exp(-.317) – 1 ≈ -.272]. Untuk t statistik
adalah tentang -1.93, yang merupakan sedikit signifikan. Sebaliknya, menggunakan pooled

OLS dari log (scrap) di y88 dan hibah memberikan ^β1 = .057 (standard error = .431).
Dengan demikian, kita menemukan ada hubungan yang signifikan antara tingkat memo dan
hibah pelatihan kerja. Sejak berbeda ini begitu banyak dari perkiraan pertama-perbedaan, itu
menunjukkan bahwa perusahaan yang memiliki pekerja-kemampuan yang lebih rendah lebih
mungkin untuk menerima hibah.

Hal ini berguna untuk mempelajari model evaluasi program yang lebih umum.

Membiarkan yit menunjukkan variabel hasil dan membiarkan progit menjadi variabel dummy
partisipasi program. Model efek tidak teramati paling sederhana adalah

Jika partisipasi program hanya terjadi pada periode kedua, maka OLS estimator β 1 dalam
persamaan dibedakan memiliki representasi yang sangat sederhana:

Artinya, kita menghitung rata-rata perubahan y selama dua periode waktu untuk pengobatan

dan kelompok kontrol. Kemudian, β^ 1 perbedaan ini. Ini adalah versi data panel dari
perbedaan-pengabaian estimator dalam persamaan (13.11) selama dua

29
pengumpulan perpotongan. Dengan data panel, kami memiliki keuntungan potensial penting:
kita dapat perbedaan y di waktu untuk sama unit cross-sectional. Hal ini memungkinkan kita
untuk kontrol untuk seseorang-, perusahaan-, atau efek kota- spesifik, sebagai model di (13.25)
membuat jelas.

Metode differencing sama bekerja untuk menganalisis efek dari setiap kebijakan yang
bervariasi di seluruh kota atau negara. Berikut ini adalah contoh sederhana.

Contoh 13.7 Pengaruh hukum Drunk Driving tentang Lalu Lintas Kematian

Banyak negara di Amerika Serikat telah mengadopsi kebijakan yang berbeda dalam
upaya untuk mengekang mengemudi dalam keadaan mabuk. Dua jenis undang- undang yang
akan kita pelajari disini adalah terbuka kontainer laws- yang membuatnya ilegal bagi
penumpang untuk memiliki wadah terbuka alkohol minuman- dan administrasi per se laws-
yang memungkinkan pengadilan untuk menangguhkan lisensi setelah sopir ditangkap karena
mengemudi dalam keadaan mabuk tapi sebelum pengemudi dihukum. Salah satu analisis yang
mungkin adalah dengan menggunakan satu bagian lintas negara untuk regresi mengemudi
korban jiwa (atau yang terkait dengan mengemudi dalam keadaan mabuk) pada indikator
variabel dummy untuk apakah setiap hukum hadir. Ini tidak mungkin untuk bekerja dengan
baik karena negara memutuskan, melalui proses legislatif, apakah mereka perlu undang-
undang tersebut. Oleh karena itu, kehadiran undang-undang kemungkinan akan terkait dengan
rata-rata mabuk mengemudi korban jiwa dalam beberapa tahun terakhir. Analisis yang lebih
meyakinkan menggunakan data panel selama periode waktu di mana beberapa negara
menerapkan undang-undang baru (dan beberapa negara mungkin telah dicabut hukum yang
ada). File TRAFFIC1 berisi data untuk tahun 1985 dan 1990 untuk semua 50 negara bagian
dan District of Columbia. dthrte). Pada tahun 1985, 19 negara memiliki undang-undang wadah
terbuka, sementara 22 negara memiliki undang- undang tersebut pada tahun 1990. Pada tahun
1985, 21 negara telah per se hukum; jumlah ini telah berkembang menjadi 29 pada tahun 1990.

30
Menggunakan OLS setelah differencing pertama memberikan

Perkiraan menunjukkan bahwa mengadopsi hukum wadah terbuka menurunkan


tingkat kematian lalu lintas dengan 0,42, efek trivial mengingat bahwa tingkat kematian rata-
rata pada tahun 1985 adalah 2,7 dengan standar deviasi sekitar 0,6. Perkiraan tersebut secara
statistik signifikan pada tingkat 5% terhadap alternatif dua sisi.

2.5 Differencing dengan Lebih Dari Dua Periode Waktu

Untuk ilustrasi, misalkan kita memiliki N individu dan T = 3 periode waktu untuk
setiap individu. Model efek tetap umum

untuk t = 1, 2, dan 3. (Jumlah pengamatan karena itu 3N.) Perhatikan bahwa kita

sekarang termasuk dua dummies waktu selain intercept. Ini adalah ide yang baik untuk
memungkinkan intercept terpisah untuk setiap periode waktu, terutama ketika kita memiliki
sejumlah kecil dari mereka. Periode dasar, seperti biasa, adalah t = 1. Intercept untuk periode
kedua kalinya adalah δ1 + δ2, dan seterusnya.
Asumsi utama adalah bahwa error istimewa tidak berkorelasi dengan variabel penjelas
dalam setiap periode waktu:
Artinya, variabel penjelas yang ketat eksogen setelah kami mengambil efek tidak teramati, α1.
(Asumsi exogeneity ketat dinyatakan dalam hal harapan bersyarat nol diberikan dalam
lampiran bab.) Asumsi (13.29) aturan keluar kasus di mana masa depan variabel penjelas
bereaksi terhadap perubahan arus dalam kesalahan istimewa,

karena harus menjadi kasus jika xitj adalah variabel dependen tertinggal. Jika kita telah
dihilangkan variabel waktu bervariasi penting, maka (13,29) umumnya dilanggar.

31
Jika α1 berkorelasi dengan xitj, kemudian xitj akan berkorelasi dengan gabungan error, vit = α1 +
uit, bawah (13,29). Kami dapat menghilangkan α1 oleh differencing periode yang berdekatan.
Dalam T = 3 kasus, kita kurangi waktu satu periode dari waktu periode dua dan jangka waktu
dua dari waktu periode tiga. Hal ini memberikan

untuk t = 2 dan 3. Kami tidak memiliki persamaan dibedakan untuk t = 1 karena tidak ada
yang dikurangi dari t = 1 persamaan. Sekarang, (13.30) merupakan dua periode waktu untuk
setiap individu dalam sampel. Jika persamaan ini memenuhi asumsi model linier klasik, OLS
kemudian dikumpulkan memberikan berisi penduga, dan biasa t dan F Statistik berlaku untuk
hipotesis. Kami juga dapat menarik hasil asimtotik.
Oleh karena itu, (13.30) tidak berisi intercept. Hal ini nyaman untuk tujuan tertentu,
termasuk perhitungan R kuadrat. Kecuali penyadapan waktu dalam model asli (13.28)
adalah bunga langsung -mereka jarang-lebih baik untuk memperkirakan persamaan pertama-
dibedakan dengan intercept dan satu periode waktu dummy, biasanya untuk periode ketiga.
Dengan kata lain, persamaan menjadi

Perkiraan dari βj identik baik formulasi. Dengan lebih dari tiga periode waktu, hal
serupa. Jika kita memiliki yang sama T periode waktu untuk masing-masing N unit cross-
sectional, kita katakan bahwa data set adalah panel seimbang: kami memiliki periode waktu
yang sama untuk semua individu, perusahaan, kota, dan sebagainya. Kapan T relatif kecil
dibandingkan N, kita harus mencakup variabel dummy untuk setiap periode waktu untuk
account untuk perubahan sekuler yang tidak dimodelkan.

Oleh karena itu, setelah differencing pertama, persamaan terlihat seperti


di mana kita memiliki T - 1 kali periode pada setiap unit i untuk persamaan pertama-
dibedakan. Jumlah pengamatan adalah N(T – 1).

32
Contoh 13.8 Pengaruh Enterprise Zona di Klaim Pengangguran

Papke (1994) meneliti efek dari (EZ) Program zona perusahaan Indiana pada klaim
pengangguran. Dia menganalisis 22 kota di Indiana selama periode dari tahun 1980 sampai
1988. Enam zona perusahaan yang ditunjuk pada tahun 1984, dan empat lagi ditugaskan pada
tahun 1985. Dua belas dari kota dalam sampel tidak menerima zona perusahaan selama periode
ini; mereka menjabat sebagai kelompok kontrol.

Sebuah model evaluasi kebijakan sederhana adalah

dimana uclmsit adalah jumlah klaim pengangguran yang diajukan selama tahun t di kota i.
parameter θt hanya menunjukkan intercept berbeda untuk setiap periode waktu. Umumnya,
klaim pengangguran jatuh di seluruh negara bagian selama periode ini, dan ini harus tercermin
dalam penyadapan tahun yang berbeda. Variabel biner ez it sama dengan satu jika kota i pada
waktu t adalah zona perusahaan; kita tertarik di β1. Efek teramati α1 merupakan faktor tetap
yang mempengaruhi iklim ekonomi di kota i. Karena zona perusahaan penunjukan tidak
ditentukan secara acak-perusahaan zona biasanya ekonomis tertekan daerah-ada kemungkinan
bahwa ezit dan α1 berkorelasi positif (tinggi α1 berarti lebih tinggi klaim pengangguran, yang
menyebabkan kesempatan yang lebih tinggi yang diberikan EZ). Dengan demikian, kita harus
perbedaan persamaan untuk menghilangkan α1:

Variabel dependen dalam persamaan ini, perubahan log (uclmsit) adalah tingkat pertumbuhan

tahunan perkiraan klaim pengangguran dari tahun t - 1 untuk t. Kita bisa memperkirakan
persamaan ini untuk tahun 1981-1988 dengan menggunakan data dalam EZUNEM; ukuran

sampel total 22·8 = 176. Perkiraan β1 adalah ^β1 = -.182 (standard error = .078). Oleh
karena itu, tampak bahwa kehadiran EZ menyebabkan

sekitar 16,6% [exp(-.182) - 1 ≈ -.166] jatuh klaim pengangguran. Ini adalah efek ekonomi yang
besar dan signifikan secara statistik.

Contoh 13.9 County Kejahatan Tarif di North Carolina

33
Cornwell dan Trumbull (1994) menggunakan data 90 kabupaten di North Carolina,
untuk tahun 1981 melalui 1987, untuk memperkirakan model efek tidak teramati kejahatan;
data yang terkandung dalam CRIME4. Di sini, kami memperkirakan versi sederhana dari
model mereka, dan kami perbedaan persamaan dari waktu ke waktu untuk menghilangkan α 1,
efek tidak teramati. (Cornwell dan Trumbull menggunakan transformasi yang berbeda, yang
akan kita bahas pada Bab 14.) Berbagai faktor termasuk lokasi geografis, sikap terhadap
kejahatan, catatan sejarah, dan konvensi melaporkan mungkin terkandung dalam α1. Tingkat
kejahatan jumlah kejahatan per orang, prbarr adalah estimasi probabilitas penangkapan,
prbconv adalah estimasi probabilitas keyakinan (diberikan penangkapan), prbpris adalah
probabilitas menjalani hukuman di penjara (diberikan keyakinan), avgsen adalah rata- rata
panjang kalimat disajikan, dan polpc adalah jumlah polisi per kapita. Seperti standar dalam
studi kriminometri, kami menggunakan log dari semua variabel untuk memperkirakan
elastisitas. Kami juga menyertakan set boneka tahun lengkap untuk mengontrol tren tingkat
kejahatan negara bagian. Kita dapat menggunakan tahun 1982 hingga 1987 untuk
memperkirakan persamaan yang berbeda. Kuantitas dalam tanda kurung adalah kesalahan
standar OLS biasa; jumlah dalam tanda kurung adalah kesalahan standar yang kuat untuk
korelasi serial dan heteroskedastisitas::

Tiga variabel probabilitas — penangkapan, penghukuman, dan hukuman penjara — semuanya

memiliki tanda yang diharapkan, dan semuanya signifikan secara statistik. Misalnya,
peningkatan 1% dalam kemungkinan penangkapan diperkirakan akan

34
menurunkan tingkat kejahatan sekitar 0,33%. Variabel kalimat rata-rata menunjukkan efek jera
yang sederhana, tetapi tidak signifikan secara statistik

Dalam ilustrasi, kami telah observasi data selama tiga tahun dengan sampel acak pada
tahun 2000, 2002, dan 2004 dan adapun model spesifiknya

2.5a Potensi Perangkap dalam Data Panel Perbedaan Pertama


Di bagian ini dan sebelumnya, kami telah menyatakan bahwa membedakan data panel
dari waktu ke waktu, untuk menghilangkan efek tak teramati yang konstan waktu, adalah
metode yang berharga untuk mendapatkan efek sebab akibat. Namun demikian, membedakan
tidak lepas dari kesulitan. Kami telah membahas masalah potensial dengan metode ini ketika
variabel penjelas utama tidak banyak berubah dari waktu ke waktu (dan metode ini tidak
berguna untuk variabel penjelas yang tidak pernah berubah dari waktu ke waktu). Sayangnya,
bahkan ketika kami memiliki variasi waktu yang cukup dalam x itj, estimasi first-differenced
(FD) dapat menimbulkan bias yang serius. Kami telah menyebutkan bahwa eksogenitas yang
ketat dari para regressor merupakan asumsi kritis.

35
BAB III

PENUTUP

3.1 Kesimpulan

Kami telah mempelajari metode untuk menganalisis kumpulan data penampang dan
panel yang dikumpulan secara independen. Penampang independen muncul ketika sampel
acak yang berbeda diperoleh dalam periode waktu yang berbeda (biasanya bertahun-tahun).
OLS menggunakan data terkumpulan adalah metode estimasi terkemuka, dan prosedur
inferensi yang biasa tersedia, termasuk koreksi untuk heteroskedastisitas. (Korelasi serial
bukan masalah karena sampel independen sepanjang waktu.) Karena dimensi rangkaian
waktu, kita sering memungkinkan penyadapan waktu yang berbeda. Kami mungkin juga
berinteraksi dengan dummies waktu dengan variabel kunci tertentu untuk melihat bagaimana
mereka telah berubah dari waktu ke waktu. Ini sangat penting dalam literatur evaluasi
kebijakan untuk eksperimen alam.
Kumpulan data panel digunakan semakin banyak dalam pekerjaan yang diterapkan,
terutama untuk analisis kebijakan. Ini adalah kumpulan data di mana unit penampang yang
sama diikuti dari waktu ke waktu. Kumpulan data panel paling berguna saat mengontrol fitur
yang tidak terenkripsi secara konstan orang, perusahaan, kota, dan sebagainya yang menurut
kami mungkin berkorelasi dengan variabel penjelasan dalam model kami. Salah satu cara
untuk menghapus efek yang tidak terlayani adalah dengan membedakan data dalam periode
waktu yang berdekatan. Kemudian, analisis OLS standar tentang perbedaan dapat digunakan.
Menggunakan dua periode data menghasilkan regresi penampang dari data yang di perbedaan.
Prosedur inferensi yang biasa secara asimptotis valid di bawah homoskedasticity; inferensi
yang tepat tersedia di bawah normalitas.
Selama lebih dari dua periode waktu, kita dapat menggunakan OLS terkumpulan pada
data yang di perbedaan; kita kehilangan periode pertama kali karena perbedaan. Selain
homoskedasticity, kita harus berasumsi bahwa kesalahan yang di perbedaan secara serial tidak
terkait untuk menerapkan statistik t dan F yang biasa. (Lampiran bab berisi daftar asumsi
yang cermat.) Tentu saja, variabel apa pun yang konstan dari waktu ke waktu keluar dari
analisis.

36
DAFTAR PUSTAKA

M Wooldridge, Jeffrey. 2016. Introductory Econometrics-A Modern Approach :


South Western College Pub

37

Anda mungkin juga menyukai