Anda di halaman 1dari 40

EKONOMETRIKA LANJUTAN (EKI 321 – B2)

CHAPTER 13

“POOLING CROSS SECTIONS ACROSS TIME: SIMPLE PANEL DATA


METHODS”

Dosen Pengampu: Drs. Sudarsana Arka, M.P.

Oleh:

KELOMPOK 1

Frima Halasson Rajagukguk (1907511265)

Kadek Aglena Parisesa (1907511076)

Fransiska Vistalia Alo (1907511247)

Kadek Dwi Reditiani (1907511257)

PROGRAM STUDI EKONOMI PEMBANGUNAN


FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS UDAYANA
JIMBARAN
2020
KATA PENGANTAR

Puji syukur kita panjatkan kehadapan Tuhan Yang Maha Esa karena
berkat rahmatlah kami dari Kelompok 13 yang membahas materi “Pertumbuhan
Ekonomi dan Masalah Lingkungan, Peranan Lingkungan dan Perekonomian,
serta Industrialisasi dan Pembangunan yang Berkelanjutan” dapat
mengerjakannya dengan lancar.

Pada makalah yang kami buat ini walaupun kami mengerjakan dengan
lancar, kami menyadari masih banyak kekurangan sehingga makalah ini belum
sempurna. Maka dari itu, kami berharap kepada pembaca untuk memberikan
kritik dan saran yang membangun demi perbaikan makalah yang akan datang.

Semoga makalah yang kami buat dapat memberi sumbangsih yang


berarti bagi pembaca karena ilmu yang didapatkan dari makalah ini.

Akhir kata, kami mohon maaf apabila ada kesalahan kata yang kami
perbuat, baik secara sengaja maupun tidak sengaja. Atas perhatiannya, kami
ucapkan terima kasih.

Bukit Jimbaran, November 2020

Penulis

I
DAFTAR ISI

KATA PENGANTAR......................................................................................................................i
DAFTAR ISI...................................................................................................................................ii
BAB I PENDAHULUAN................................................................................................................1
1.1 Latar Belakang......................................................................................................................1
1.2 Rumusan Masalah.................................................................................................................2
1.3 Tujuan....................................................................................................................................2
BAB II PEMBAHASAN..................................................................................................................3
2.1 Pooling Independent Cross Sections across Time.................................................................4
2.1a The Chow Test for Structural Change across Time......................................................10
2.2 Policy Analysis with Pooled Cross Sections (Analisis Kebijakan dengan Crossed Section)
...................................................................................................................................................11
2.3 Two-Period Panel Data Analysis (Analisis Data Panel Dua Periode).................................19
2.3a. Organizing Panel Data (Mengatur Data Panel)...........................................................25
2.4 Analisis kebijakan dengan Dua Periode data Panel............................................................26
2.5 Differencing dengan Lebih Dari Dua Periode Waktu.........................................................30
2.5a Potensi Perangkap dalam Data Panel Perbedaan Pertama..........................................33
BAB III PENUTUP.......................................................................................................................35
3.1 Kesimpulan..........................................................................................................................35
DAFTAR PUSTAKA....................................................................................................................36

II
BAB I

PENDAHULUAN

1.1 Latar Belakang

Dalam Chapter 13 ini, kami menunjukkan cara menerapkan beberapa


regresi ke penampang yang dikumpulan secara independen. Masalah yang
diangkat sangat mirip dengan analisis penampang standar, kecuali bahwa kita
dapat mempelajari bagaimana hubungan berubah dari waktu ke waktu dengan
menyertakan variabel dummy waktu. Kami juga menggambarkan bagaimana
kumpulan data panel dapat dianalisis dalam kerangka kerja regresi.
Sampai sekarang, kami telah membahas beberapa analisis regresi
menggunakan data seri waktu penampang murni atau murni. Meskipun kedua
kasus ini sering muncul dalam aplikasi, kumpulan data yang memiliki dimensi
crosssectional dan time series digunakan semakin sering dalam penelitian
empiris. Beberapa metode regresi masih dapat digunakan pada kumpulan data
tersebut. Bahkan, data dengan aspek cross-sectional dan time series seringkali
dapat menjelaskan pertanyaan kebijakan penting. Kita akan melihat beberapa
contoh dalam bab ini.
Kami akan menganalisis dua jenis kumpulan data dalam bab
ini. Penampang yang dikumpulan secara independen diperoleh dengan
mengambil sampel secara acak dari populasi besar pada titik waktu yang
berbeda (biasanya, tetapi belum tentu, tahun yang berbeda). Misalnya, dalam
setiap tahun, kita dapat menggambar sampel acak pada upah per jam,
pendidikan, pengalaman, dan sebagainya, dari populasi orang yang bekerja di
Amerika Serikat. Atau, di setiap tahun, kami menggambar sampel acak pada
harga jual, rekaman persegi, jumlah kamar mandi, dan sebagainya, rumah-
rumah yang dijual di daerah metropolitan tertentu. Dari sudut pandang statistik,
kumpulan data ini memiliki fitur penting: mereka terdiri dari pengamatan  yang
diambil sampel secara independen. Ini juga merupakan aspek kunci dalam
analisis data penampang kami: antara lain, ini mengesampingkan korelasi
dalam istilah kesalahan di berbagai pengamatan.
Penampang yang dikumpulan secara independen berbeda dari satu
sampel acak dalam pengambilan sampel dari populasi pada titik waktu yang
berbeda kemungkinan mengarah pada pengamatan yang tidak didistribusikan
secara identik. Misalnya, distribusi upah dan pendidikan telah berubah dari
waktu ke waktu di sebagian besar negara. Seperti yang akan kita lihat, ini mudah
ditangani dalam praktiknya dengan memungkinkan penyadapan dalam model
regresi ganda, dan dalam beberapa kasus lereng, untuk berubah dari waktu ke
waktu. Kami membahas model seperti itu di Bagian 13-1. Di Bagian 13-1, kami

1
membahas bagaimana penampang pooling dari waktu ke waktu dapat digunakan
untuk mengevaluasi perubahan kebijakan.
Kumpulan data panel, sambil memiliki dimensi penampang dan
rangkaian waktu, berbeda dalam beberapa hal penting dari penampang yang
dikumpulan secara independen. Untuk mengumpulkan data panel
terkadang disebut data longitudinal kami mengikuti (atau berusaha
mengikuti) individu,  keluarga, perusahaan, kota, negara bagian, atau apa pun
yang sama, sepanjang waktu. Misalnya, data panel yang ditetapkan pada upah
individu, jam, pendidikan, dan faktor lainnya dikumpulkan dengan memilih
orang secara acak dari populasi pada titik waktu tertentu. Kemudian, orang-
orang yang sama ini diinterview ulang pada beberapa titik berikutnya pada
waktunya. Ini memberi kita data tentang upah, jam kerja, pendidikan, dan
sebagainya, untuk kelompok orang yang sama di tahun yang berbeda.

1.2 Rumusan Masalah

Berdasarkan uraian diatas maka makalah ini secara khusus membahas


materi mengenai Pooling Cross Sections across Time: Simple Panel Data
Methods.

1.3 Tujuan

Untuk memahami mengenai Pooling Cross Sections across Time:


Simple Panel Data Methods dan menyelesai tugas yang diberikan.

2
BAB II

PEMBAHASAN

Pooling Cross Sections across Time: Simple Panel Data Methods

Cross section yang dikumpulkan secara independent diperoleh dengan


mengambil sampel secara acak dari populasi besar pada titik waktu yang
berbeda (biasanya, tetapi belum tentu, tahun yang berbeda). Misalnya, di setiap
tahun, kami dapat menggambar sampel acak setiap jam upah, pendidikan,
pengalaman, dan sebagainya, dari populasi orang yang bekerja di Amerika
Serikat. Atau, pada setiap tahun lai nnya, kami mengambil sampel acak pada
harga jual, ukuran persegi, jumlah kamar mandi, dan sebagainya, rumah yang
dijual di daerah metropolitan tertentu. Dari sudut pandang statistik, set data ini
memiliki fitur penting: mereka terdiri dari observasi sampel independen. Ini juga
merupakan aspek kunci dalam analisis kami data cross-sectional: antara lain, itu
mengesampingkan korelasi dalam hal error di pengamatan yang berbeda.

Cross section yang dikumpulkan secara independen berbeda dari sampel


acak tunggal dalam pengambilan sampel itu dari populasi pada titik yang
berbeda dalam waktu cenderung mengarah pada pengamatan yang tidak identik
didistribusikan. Sebagai contoh, distribusi upah dan pendidikan telah berubah
dari waktu ke waktu di sebagian besar negara. Seperti yang akan kita lihat, ini
mudah untuk ditangani dalam praktik dengan memungkinkan intercept dalam
model regresi berganda, dan dalam beberapa kasus slope, berubah seiring waktu.
Kami membahas model seperti itu di Bagian 2.1. Di Bagian 2.1, kami
membahas bagaimana mengumpulkan perpotongan atau persilangan dari waktu
ke waktu dapat digunakan untuk mengevaluasi perubahan kebijakan.

Kumpulan data panel, walaupun memiliki dimensi cross-sectional dan


time series, berbeda dalam beberapa hal. hal-hal penting dari perpotongan atau
persilangan yang dikumpulkan secara independen. Untuk mengumpulkan data
panel (terkadang disebut data longitudinal) kami mengikuti (atau berupaya
mengikuti) individu, keluarga, firma, kota, negara bagian yang sama, atau apa
pun, sepanjang waktu. Sebagai contoh, satu set data panel pada upah individu,
jam, pendidikan, dan faktor-faktor lain dikumpulkan dengan secara acak

3
memilih orang-orang dari suatu populasi pada suatu titik tertentu dalam satu
waktu. Kemudian, orang-orang yang sama ini ditinjau kembali pada beb erapa
titik waktu berikutnya. Ini memberi kita data tentang upah, jam, pendidikan, dan
sebagainya, untuk kelompok orang yang sama di tahun yang berbeda.

Kumpulan data panel cukup mudah dikumpulkan untuk distrik sekolah,


kota, kabupaten, negara bagian, dan negara, dan analisis kebijakan sangat
ditingkatkan dengan menggunakan set data panel; kita akan melihat beberapa
contoh didiskusi berikut. Untuk analisis ekonometrik data panel, kami tidak
dapat mengasumsikan bahwa pengamatan didistribusikan secara independen
sepanjang waktu. Misalnya, faktor yang tidak teramati (seperti kemampuan)
yang memengaruhi upah seseorang pada tahun 1990 juga akan memengaruhi
upah orang itu pada tahun 1991; faktor yang tidak teramati yang mempengaruhi
tingkat kejahatan kota pada tahun 1985 juga akan mempengaruhi tingkat
kejahatan kota itu pada tahun 1990. Karena alasan ini, model dan metode khusus
telah dikembangkan untuk menganalisis data panel. Dalam Bagian 2.3, 2.4, dan
2.5, kami menggambarkan metode pembedaan langsung untuk menghilangkan
konstanta waktu, atribut unit yang sedang dipelajari tidak teramati. Karena
metode data panel agak lebih maju, kami sebagian besar akan mengandalkan
intuisi dalam menggambarkan sifat statistik dari prosedur estimasi,
meninggalkan asumsi terperinci pada lampiran BAB. Kami mengikuti strategi
yang sama di BAB 14, yang mencakup metode data panel yang lebih rumit.

2.1 Pooling Independent Cross Sections across Time

Banyak survei individu, keluarga, dan perusahaan diulangi secara berkala,


seringkali setiap tahun. Sebuah contohnya adalah Survei Penduduk Saat Ini (CPS),
yang secara acak mengambil sampel rumah tangga setiap tahun. (Lihat, misalnya,
CPS78_85, yang berisi data dari CPS 1978 dan 1985). Jika sampel acak diambil pada
setiap periode waktu, mengumpulkan sampel acak yang dihasilkan memberi kita
gabungan secara independent persilangan.

Salah satu alasan untuk menggunakan perpotongan atau persilangan yang


dikumpulkan secara independen adalah untuk meningkatkan ukuran sampel. Dengan
mengumpulkan sampel acak yang diambil dari populasi yang sama, tetapi pada titik

4
waktu yang berbeda, kita bisa mendapatkan lebih banyak penduga yang tepat dan
statistik uji dengan kekuatan lebih besar. Pooling sangat membantu dalam hal ini hanya
sejauh hubungan antara variabel dependen dan setidaknya beberapa variabel
independen tetap ada konstan sepanjang waktu.

Seperti yang disebutkan dalam pendahuluan, menggunakan perpotongan atau


persilangan yang dikumpulkan mengumpulkan hanya komplikasi statistik kecil.
Biasanya, untuk mencerminkan fakta bahwa populasi mungkin memiliki distribusi yang
berbeda pula periode waktu, kami memungkinkan intersepsi berbeda antar periode,
biasanya tahun. Ini mudah dilakukan dengan memasukkan variabel dummy untuk
semua kecuali satu tahun, di mana tahun paling awal dalam sampel adalah biasanya
dipilih sebagai tahun dasar. Mungkin juga varians kesalahan berubah seiring waktu,
sesuatu yang akan kita diskusikan nanti.

Kadang-kadang, pola koefisien pada variabel dummy tahun itu sendiri menarik.
Misalnya, seorang demografi mungkin tertarik pada pertanyaan berikut: Setelah
mengontrol pendidikan, pola kesuburan di antara wanita di atas 35 berubah antara tahun
1972 dan 1984? Mengikuti contoh menggambarkan bagaimana pertanyaan ini dijawab
dengan menggunakan analisis regresi berganda variabel dummy tahunan.

Example 13.1 Women’s Fertility over Time

Kumpulan data dalam FERTIL1, yang mirip dengan yang digunakan oleh
Sander (1992), berasal dari National Survei Sosial Umum Pusat Penelitian Opini untuk
tahun-tahun genap 1972 hingga 1984, secara inklusif. Kami menggunakan data ini
untuk memperkirakan model yang menjelaskan jumlah total anak yang dilahirkan oleh
seorang wanita (anak-anak). Satu pertanyaan yang menarik adalah: Setelah
mengendalikan faktor-faktor lain yang dapat diamati, apa yang terjadi tingkat
kesuburan dari waktu ke waktu? Faktor-faktor yang kami kendalikan adalah tahun
pendidikan, usia, ras, wilayah negara tempat tinggal pada usia 16, dan lingkungan
hidup pada usia 16 tahun. Perkiraannya diberikan pada Tabel 13.1. Tahun dasar adalah
1972. Koefisien pada variabel dummy tahun menunjukkan penurunan tajam dalam
kesuburan pada awal 1980-an. Misalnya, koefisien pada y82 menyiratkan bahwa,
mengadakan pendidikan, usia, dan faktor-faktor lain tetap, seorang wanita rata-rata
memiliki 0,5 anak lebih sedikit, atau sekitar setengah anak, pada tahun 1982
dibandingkan pada tahun 1972. Ini adalah penurunan yang sangat besar:

5
mempertahankan pendidikan, usia, dan faktor-faktor lain tetap, 100 wanita pada tahun
1982 diperkirakan memiliki sekitar 52 anak lebih sedikit dari 100 wanita yang
sebanding pada tahun 1972. Karena kita mengendalikan pendidikan, penurunan ini
terpisah dari penurunan kesuburan yang disebabkan oleh peningkatan tingkat
pendidikan rata-rata. (Rata-rata tahun pendidikan adalah 12,2 untuk 1972 dan 13,3
untuk 1984.) koefisien pada y82 dan y84 mewakili penurunan kesuburan karena alasan
yang tidak ditangkap dalam variabel penjelas. Mengingat bahwa dummies tahun 1982
dan 1984 secara individual cukup signifikan, tidak mengherankan bahwa sebagai
kelompok, tahun dummies bersama-sama sangat signifikan: R-kuadrat untuk regresi
tanpa tahun dummies adalah 0,1019, dan ini mengarah ke F6,1111 = 5,87 dan p-value = 0

Wanita dengan pendidikan lebih banyak memiliki anak lebih sedikit, dan
perkiraan ini sangat signifikan secara statistik. Hal lain dianggap sama, 100 wanita

6
dengan pendidikan tinggi akan memiliki sekitar 51 anak lebih sedikit rata-rata dari
100 wanita dengan hanya pendidikan sekolah menengah: 0.128(4) = 0.512. Usia
memiliki efek yang semakin berkurang pada kesuburan. (Titik balik dalam kuadrat
adalah sekitar usia = 46, pada saat itu paling banyak wanita telah selesai memiliki
anak.)

Model yang diperkirakan pada Tabel 13.1 mengasumsikan bahwa efek dari
masing-masing variabel penjelas, khususnya pendidikan, tetap konstan. Hal ini bisa
benar bisa juga tidak.

Akhirnya, mungkin ada heteroskedastisitas dalam istilah error yang


mendasari persamaan estimasi. Ada satu perbedaan yang menarik. sekarang, varian
error dapat berubah dari waktu ke waktu bahkan jika itu tidak berubah dengan nilai-
nilai pendidikan, usia, kulit dan seterusnya. Namun demikian, eror standar
heteroskedastisitas-kuat dan statistik uji valid. Tes Breusch-Pagan akan diperoleh
dengan regresi residu OLS kuadrat pada semua variabel independen pada Tabel
13.1, termasuk tahun dummy. (Untuk kasus khusus statistik White, nilai yang
dipasang anak-anak dan nilai yang dipasang kuadrat digunakan sebagai variabel
independen, selalu.) Prosedur kuadrat terkecil tertimbang harus memperhitungkan
varians yang mungkin berubah waktu.

Example 13.2 Changes in the Return to Education and the Gender Wage Gap

Persamaan log (upah) (di mana upah adalah upah per jam) dikumpulkan
selama tahun 1978 (tahun dasar) dan 1985 adalah

di mana sebagian besar variabel penjelas sekarang sudah tidak asing lagi. Serikat
variabel adalah variable dummy sama dengan satu jika orang itu milik serikat, dan
nol sebaliknya. Variabel y85 adalah dummy variabel sama dengan satu jika
pengamatan berasal dari tahun 1985 dan nol jika berasal dari tahun 1978. Ada 550
orang dalam sampel pada tahun 1978 dan satu set berbeda 534 orang pada tahun
1985.

7
Intercept untuk 1978 adalah β0, dan intersep untuk 1985 adalah β0 + δ0.
Kembali ke pendidikan di Indonesia 1978 adalah β1, dan kembali ke pendidikan
pada tahun 1985 adalah β1 + δ1. Karena itu, δ1 mengukur bagaimana kembalinya
kesatu tahun lagi pendidikan setelah berubah selama periode tujuh tahun. Akhirnya,
pada tahun 1978, perbedaan log (upah) antara perempuan dan laki-laki adalah β5;
diferensial pada tahun 1985 adalah β5 + δ5. Jadi, kita bisa menguji nol hipotesis
bahwa tidak ada yang terjadi pada perbedaan gender selama periode tujuh tahun ini
dengan pengujian H0: δ5 = 0. Alternatif yang mengurangi perbedaan gender adalah
H1: δ5 > 0. Untuk kesederhanaan, kami berasumsi bahwa pengalaman dan
keanggotaan serikat memiliki efek yang sama terhadap upah di kedua waktu
tersebut.

Sebelum kami menyajikan estimasi, ada satu masalah lain yang perlu kami
tangani — yaitu, setiap jam upah di sini adalah dalam dolar nominal (atau saat ini).
Karena upah nominal tumbuh hanya karena inflasi, kami benar-benar tertarik pada
pengaruh masing-masing variabel penjelas terhadap upah riil. Misalkan kita sepakat
untuk mengukur upah pada tahun 1978 dolar. Ini membutuhkan upah 1985 dikurangi
menjadi 1978 dolar. (Menggunakan Indeks Harga Konsumen untuk Laporan
Ekonomi Presiden 1997, faktor deflasi adalah 107.6 / 65.2 <1.65.) Meskipun kita
dapat dengan mudah membagi masing-masing upah 1985 dengan 1,65, ternyata ini
adalah tidak perlu, asalkan dummy tahun 1985 dimasukkan dalam regresi dan log
(upah) (sebagai lawan untuk upah) digunakan sebagai variabel dependen.
Menggunakan upah riil atau nominal dalam fungsi logaritmik bentuk hanya
mempengaruhi koefisien pada boneka tahun, y85. Untuk melihat ini, misalkan P85
menunjukkan faktor deflasi untuk upah 1985 (1,65, jika kita menggunakan CPI).
Kemudian, log upah riil untuk setiap orang di i pada Sampel 1985 adalah

Sekarang, sementara wage1 berbeda antar orang, P85 tidak. Oleh karena itu,
log (P85) akan diserap ke dalam intersep untuk 1985. (Kesimpulan ini akan berubah
jika, misalnya, kami menggunakan indeks harga yang berbeda untuk orang yang
tinggal di berbagai bagian negara.) Intinya adalah, untuk mempelajari bagaimana

8
kembali ke pendidikan atau kesenjangan gender telah berubah, kita tidak perlu
mengubah upah nominal menjadi upah riil di Indonesia persamaan (13.1).

Jika kita lupa untuk memperbolehkan intercept yang berbeda pada tahun
1978 dan 1985, penggunaan upah nominal dapat menghasilkan hasil serius
menyesatkan. Jika kita menggunakan upah daripada log (upah) sebagai variabel
dependen, itu penting untuk menggunakan upah nyata dan untuk memasukkan
dummy setahun.

Diskusi sebelumnya biasanya berlaku ketika menggunakan nilai dolar untuk


dependen atau Variabel independen. Asalkan jumlah dolar muncul dalam bentuk
logaritmik dan variabel dummy digunakan untuk semua periode waktu (kecuali,
periode dasar), penggunaan deflator harga agregat hanya akan mempengaruhi
penyadapan; tak satu pun dari perkiraan slope akan berubah.

Sekarang, kami menggunakan data dalam CPS78_85 untuk memperkirakan


persamaan:

Kembali ke pendidikan pada tahun 1978 diperkirakan sekitar 7,5%; kembali


ke pendidikan pada tahun 1985 adalah sekitar 1,85 poin persentase lebih tinggi, atau
sekitar 9,35%. Karena t statistik pada istilah interaksi adalah 0,0185 / 0,0094 = 1,97,
perbedaan pengembalian pendidikan secara statistik signifikan pada tingkat 5%
terhadap alternatif dua sisi. Bagaimana dengan kesenjangan gender? Pada 1978, hal-
hal lain dianggap setara, seorang wanita berpenghasilan tinggi 31,7% lebih rendah
dari seorang pria (27,2% adalah perkiraan yang lebih akurat). Pada tahun 1985,
kesenjangan dalam log (upah) adalah -0.317 + 0.085 = -0.232. Oleh karena itu,
kesenjangan gender tampaknya telah menurun sejak 1978 hingga 1985 olehsekitar
8,5 poin persentase. Statistik t pada istilah interaksi adalah sekitar 1,67, yang artinya
adalah signifikan pada tingkat 5% terhadap alternatif satu sisi yang positif.

9
Apa yang terjadi jika kita berinteraksi dengan semua variabel independen
dengan persamaan y85 (13.2)? Ini identik dengan memperkirakan dua persamaan
terpisah, satu untuk 1978 dan satu untuk 1985. Kadang-kadang, ini diinginkan.
Sebagai contoh, dalam Bab 7, kami membahas studi oleh Krueger (1993), di mana ia
memperkirakan kembalinya untuk menggunakan komputer di tempat kerja. Krueger
memperkirakan dua persamaan terpisah, satu menggunakan CPS 1984 dan yang
lainnya menggunakan CPS 1989. Dengan membandingkan bagaimana kembalinya
pendidikan berubah sepanjang waktu dan apakah penggunaan komputer dikontrol
atau tidak, ia memperkirakan sepertiga hingga setengahnya peningkatan yang
diamati dalam pengembalian pendidikan selama periode lima tahun dapat dikaitkan
dengan peningkatan penggunaan computer.

2.1a The Chow Test for Structural Change across Time

Dalam Bab 7, kami membahas bagaimana uji Chow — yang hanya merupakan
uji F — dapat digunakan untuk menentukan apakah fungsi regresi berganda berbeda
di dua kelompok. Kita bisa menerapkan tes itu ke dua periode waktu yang berbeda
juga. Salah satu bentuk tes memperoleh jumlah residual kuadrat dari estimasi
gabungan sebagai SSR terbatas. SSR yang tidak dibatasi adalah jumlah dari SSR
untuk keduanya Diperkirakan secara terpisah periode waktu. Mekanisme
penghitungan statistik sama persis seperti sebelumnya dalam Bagian 7-4. Versi
heteroskedasticity-robust juga tersedia.

Contoh 13.2 menyarankan cara lain untuk menghitung uji Chow selama dua
periode waktu dengan berinteraksi masing-masing variabel dengan dummy tahun
untuk satu dari dua tahun dan pengujian untuk signifikansi bersama tahun ini dummy
dan semua istilah interaksi. Karena intersep dalam model regresi sering berubah
waktu (karena, katakanlah, inflasi dalam contoh harga perumahan), tes Chow full-
blown ini dapat mendeteksi hal perubahan tersebut. Biasanya lebih menarik untuk
memungkinkan perbedaan intersepsi dan kemudian menguji apakah koefisien slope
tertentu berubah seiring waktu (seperti yang kami lakukan dalam Contoh 13.2)

Tes Chow dapat dihitung selama lebih dari dua periode waktu. Sama seperti
dalam kasus dua periode, biasanya lebih menarik untuk memungkinkan intersepsi
berubah dari waktu ke waktu dan kemudian menguji apakah koefisien slope telah

10
berubah seiring waktu. Kita dapat menguji keteguhan koefisien slope secara umum
berinteraksi dengan semua dummy waktu-periode (kecuali yang mendefinisikan
kelompok dasar) dengan satu, beberapa, atau semua variabel penjelas dan uji
signifikansi bersama dari istilah interaksi. Untuk banyak periode waktu dan variabel
penjelas, membangun interaksi penuh bisa membosankan. Pertama, perkirakan model
terbatas dengan melakukan gabungan regresi memungkinkan intercept waktu yang
berbeda; ini memberi SSRr. Kemudian, jalankan regresi untuk masing-masing
katakanlah, periode waktu T dan dapatkan jumlah residual kuadrat untuk setiap
periode waktu. Yang tidak dibatasi jumlah residual kuadrat diperoleh sebagai SSR ur =
SSR1 + SSR2 +…+ SSRT. Jika ada k variabel penjelas (tidak termasuk intersepsi atau
dummies waktu) dengan periode waktu T, maka kami menguji batasan (T-1) k, dan
ada parameter T + Tk yang diperkirakan dalam model tidak dibatasi. Jadi jika n = n1
+ n2 +…+ nT adalah jumlah total pengamatan, maka df dari uji F adalah (T-1) k dan
n - T - Tk. Kami menghitung statistik F seperti biasa: [(SSR r – SSRur ) / SSRur ] [( n –
T – Tk) / (T-1) k]. Sayangnya, seperti halnya dengan uji F berdasarkan jumlah
residual kuadrat atau R-kuadrat, tes ini tidak kuat terhadap heteroskedastisitas
(termasuk perubahan varian sepanjang waktu). Untuk mendapatkan uji
heteroskedastisitas-kuat, harus membangun istilah interaksi dan melakukan regresi
gabungan.

2.2 Policy Analysis with Pooled Cross Sections (Analisis Kebijakan dengan
Crossed Section)

Potongan melintang yang dikumpulkan dapat sangat berguna untuk


mengevaluasi dampak dari suatu peristiwa atau kebijakan tertentu. Contoh studi acara
berikut menunjukkan bagaimana dua set data cross-sectional, dikumpulkan sebelum
dan setelah terjadinya suatu peristiwa, dapat digunakan untuk menentukan efek pada
hasil ekonomi.

Example 13.3 Effect of a Garbage Incinerator’s Location on Housing Prices


(Pengaruh Lokasi Insinerator Sampah terhadap Harga Rumah)

Kiel dan McClain (1995) mempelajari efek yang dimiliki insinerator sampah
baru terhadap nilai perumahan di North Andover, Massachusetts. Mereka

11
menggunakan data bertahun-tahun dan analisis ekonometrik yang cukup rumit. Kami
akan menggunakan dua tahun data dan beberapa model yang disederhanakan, tetapi
analisis kami serupa.

Desas-desus bahwa insinerator baru akan dibangun di Andover Utara dimulai


setelah tahun 1978, dan Konstruksi dimulai pada tahun 1981. Insinerator itu
diharapkan akan beroperasi segera setelah dimulainya konstruksi; insinerator
sebenarnya mulai beroperasi pada tahun 1985. Kami akan menggunakan data tentang
harga rumah yang dijual pada tahun 1978 dan sampel lain dari yang dijual pada tahun
1981. Hipotesisnya adalah bahwa harga rumah yang terletak di dekat insinerator akan
turun relatif terhadap harga lebih banyak. rumah yang jauh.

Sebagai ilustrasi, kami mendefinisikan sebuah rumah yang dekat dengan


insinerator jika jaraknya tiga mil. [Dalam Latihan Komputer C3, Anda malah diminta
untuk menggunakan jarak sebenarnya dari rumah ke insinerator, seperti dalam Kiel
dan McClain (1995).] Kita akan mulai dengan melihat efek dolar pada harga rumah.
Ini mengharuskan kita untuk mengukur harga dalam dolar konstan. Kami mengukur
semua harga rumah dalam dolar 1978, menggunakan indeks harga perumahan Boston.
Biarkan rprice menunjukkan harga rumah secara riil. Seorang analis yang naif hanya
akan menggunakan data tahun 1981 dan memperkirakan model yang sangat
sederhana:

rprice = γ 0 + γ 1nearinc + u [13.3]

di mana nearinc adalah variabel biner sama dengan satu jika rumah dekat insinerator,
dan nol sebaliknya. Memperkirakan persamaan ini menggunakan data dalam
KIELMC memberi

= 101,307.5 – 30,688.27 nearinc [13.4]

(3,093.0) (5,827.71)

n = 142, R2 = .165.

Karena ini adalah regresi sederhana pada variabel dummy tunggal, intersep
adalah harga jual rata-rata untuk rumah tidak di dekat insinerator, dan koefisien pada
hampir adalah perbedaan dalam harga jual rata-rata antara rumah di dekat insinerator
dan yang tidak. Perkiraan menunjukkan bahwa harga jual rata-rata untuk kelompok

12
sebelumnya adalah $ 30.688,27 kurang dari untuk kelompok yang terakhir. Statistik t
lebih dari lima dalam nilai absolut, jadi kita dapat dengan kuat menolak hipotesis
bahwa nilai rata-rata untuk rumah yang dekat dan jauh dari insinerator adalah sama.
Sayangnya, persamaan (13.4) tidak menyiratkan bahwa penempatan insinerator
menyebabkan nilai perumahan yang lebih rendah. Bahkan, jika kita menjalankan
regresi yang sama untuk 1978 (sebelum insinerator bahkan dikabarkan), kita dapatkan

= 82,517.23 – 18,824.37 nearinc [13.5]

(2,653.79) (4,744.59)

n = 179, R2 = .082.

Oleh karena itu, bahkan sebelum ada pembicaraan tentang insinerator, nilai
rata-rata rumah di dekat lokasi adalah $ 18.824,37 lebih rendah dari nilai rata-rata
rumah yang tidak dekat lokasi ($ 82.517,23); perbedaannya juga signifikan secara
statistik. Ini konsisten dengan pandangan bahwa insinerator dibangun di daerah
dengan nilai perumahan yang lebih rendah. Lalu, bagaimana kita dapat mengetahui
apakah membangun insinerator baru menekan nilai perumahan? Kuncinya adalah
untuk melihat bagaimana koefisien pada hampir berubah antara 1978 dan 1981.
Perbedaan dalam nilai rata-rata perumahan jauh lebih besar pada tahun 1981
dibandingkan pada tahun 1978 ($ 30.688,27 dibandingkan $ 18.824,37), bahkan
sebagai persentase dari nilai rata-rata rumah tidak dekat dengan situs insinerator.
Perbedaan dalam dua koefisien pada hampir adalah

= -30,688.27 – (-18,824.37) = -11,863.9.

Ini adalah perkiraan kami tentang pengaruh insinerator pada nilai rumah di
dekat lokasi insinerator. Dalam ekonomi empiris, telah dikenal sebagai estimator
perbedaan-dalam-perbedaan karena dapat dinyatakan sebagai

[13.6]

di mana nr adalah singkatan dari “near the insinerator site” dan fr singkatan dari

“farther away from the site.” Dengan kata lain, adalah selisih waktu dalam selisih

rata-rata harga rumah di kedua lokasi. Untuk menguji apakah berbeda secara

13
statistik dari nol, kita perlu menemukan kesalahan standarnya dengan menggunakan

analisis regresi. Bahkan, dapat diperoleh dengan memperkirakan


rprice = β 0 + δ Qy81 + β 1nearinc + δ 1y81.nearinc + u [13.7]
Menggunakan data yang dikumpulkan selama dua tahun. Intersep, , adalah
harga rata-rata rumah yang tidak dekat dengan insinerator pada tahun 1978. Parameter

menangkap perubahan dalam semua nilai perumahan di Andover Utara dari 1978
hingga 1981. [Perbandingan persamaan (13.4) dan (13.5) menunjukkan bahwa nilai
perumahan di North Andover, relatif terhadap indeks harga perumahan Boston,

meningkat tajam selama periode ini.] Koefisien pada nearinc, , mengukur lokasi
efek yang tidak disebabkan oleh keberadaan insinerator: seperti yang kita lihat dalam
persamaan (13.5), bahkan pada tahun 1978, rumah di dekat lokasi insinerator dijual
dengan harga kurang dari rumah yang lebih jauh dari lokasi.

Parameter yang menarik adalah pada jangka waktu interaksi y81 · hampir: d1
mengukur penurunan nilai perumahan akibat insinerator baru, asalkan kami berasumsi
bahwa rumah yang dekat dan jauh dari lokasi tidak menghargai pada tingkat yang
berbeda karena alasan lain. Estimasi persamaan (13.7) diberikan pada kolom (1) dari
Tabel 13.2. Satu-satunya angka yang tidak dapat kita peroleh dari persamaan (13.4)

dan (13.5) adalah kesalahan standar . Statistik t pada adalah sekitar 21.59,
yang sedikit signifikan terhadap alternatif 1p-sisi satu sisi < .0572. Kiel dan McClain
(1995) memasukkan berbagai karakteristik perumahan dalam analisis penentuan tapak
insinerator. Ada dua alasan bagus untuk melakukan ini. Pertama, jenis rumah yang
dijual di dekat insinerator pada tahun 1981 mungkin secara sistematis berbeda dengan
yang dijual di dekat insinerator pada tahun 1978; jika demikian, penting untuk
mengendalikan karakteristik tersebut. Kedua, bahkan jika karakteristik rumah yang
relevan tidak berubah, termasuk mereka dapat sangat mengurangi varians kesalahan,

yang kemudian dapat mengecilkan kesalahan standar . (Lihat Bagian 6-3 untuk
diskusi.) Dalam kolom (2), kami kontrol untuk umur rumah, menggunakan kuadratik.
Ini secara substansial meningkatkan R-squared (dengan mengurangi varians residual).
Koefisien pada y81 · nearinc sekarang besarnya jauh lebih besar, dan kesalahan
standarnya lebih rendah.

Selain variabel umur dalam kolom (2), kolom (3) mengontrol jarak ke jalan
kaki (intstate), luas tanah di kaki (tanah), luas rumah di kaki (area), jumlah kamar

14
(kamar) , dan jumlah pemandian (baths). Ini menghasilkan perkiraan pada y81 ·
mendekati mendekati tanpa kontrol, tetapi menghasilkan kesalahan standar yang jauh
lebih kecil: statistik t untuk adalah sekitar 22,84. Oleh karena itu, kami
menemukan efek yang jauh lebih signifikan di kolom (3) daripada di kolom (1).
Kolom (3) perkiraan lebih disukai karena mereka mengendalikan sebagian besar
faktor dan memiliki kesalahan standar terkecil (kecuali dalam konstanta, yang tidak
penting di sini). Fakta bahwa nearinc memiliki koefisien yang jauh lebih kecil dan
tidak signifikan pada kolom (3) menunjukkan bahwa karakteristik yang termasuk
dalam kolom (3) sebagian besar menangkap karakteristik perumahan yang paling
penting untuk menentukan harga rumah.

Untuk tujuan memperkenalkan metode ini, kami menggunakan tingkat harga


perumahan nyata pada Tabel 13.2. Lebih masuk akal untuk menggunakan log (harga)
[atau log (rprice)] dalam analisis untuk mendapatkan efek persentase perkiraan.
Model dasar menjadi

log(price) = β 0 + δ 0y81 + β 1nearinc +δ 1y81.nearinc + u [13.8]

15
Sekarang, 100 # adalah perkiraan persentase penurunan nilai perumahan
karena insinerator. [Seperti dalam Contoh 13.2, menggunakan log (harga) versus log
(rprice) hanya memengaruhi koefisien pada y81.] Menggunakan 321 observasi yang
sama memberikan

[13.9]

Koefisien pada istilah interaksi menyiratkan bahwa, karena insinerator baru,


rumah-rumah di dekat insinerator kehilangan nilai sekitar 6,3%. Namun, perkiraan ini
tidak berbeda secara statistik dari nol. Tetapi ketika kita menggunakan satu set kontrol
penuh, seperti pada kolom (3) dari Tabel 13.2 (tetapi dengan intst, tanah, dan area
muncul dalam bentuk logaritmik), koefisien pada y81 · nearinc menjadi 2.132 dengan
statistik t sekitar 22.53. Sekali lagi, mengendalikan faktor-faktor lain ternyata penting.
Menggunakan bentuk logaritmik, kami memperkirakan bahwa rumah-rumah di dekat
insinerator didevaluasi sekitar 13,2%.

Metodologi yang digunakan dalam contoh sebelumnya memiliki banyak


aplikasi, terutama ketika data muncul dari eksperimen alami (atau eksperimen semu).
Eksperimen alami terjadi ketika beberapa peristiwa eksogen, sering kali merupakan
perubahan dalam kebijakan pemerintah mengubah lingkungan tempat individu,
keluarga, perusahaan, atau kota beroperasi. Eksperimen alami selalu memiliki
kelompok kontrol, yang tidak terpengaruh oleh perubahan kebijakan, dan kelompok
perlakuan, yang dianggap dipengaruhi oleh perubahan kebijakan. Tidak seperti
eksperimen sejati, di mana kelompok perlakuan dan kontrol dipilih secara acak dan
eksplisit, kelompok kontrol dan perlakuan dalam eksperimen alami muncul dari
perubahan kebijakan tertentu. Untuk mengendalikan perbedaan sistematis antara
kelompok kontrol dan kelompok perlakuan, kami membutuhkan dua tahun data, satu
sebelum perubahan kebijakan dan satu setelah perubahan. Dengan demikian, sampel
kami bermanfaat dibagi menjadi empat kelompok: kelompok kontrol sebelum
perubahan, kelompok kontrol setelah perubahan, kelompok perlakuan sebelum
perubahan, dan kelompok perlakuan setelah perubahan. Panggil C kelompok kontrol
dan T kelompok perlakuan, biarkan dT sama dengan kesatuan untuk kelompok

16
perlakuan T, dan nol sebaliknya. Kemudian, membiarkan d2 menunjukkan variabel
dummy untuk periode waktu kedua (perubahan postpolicy), persamaan bunga adalah

y = β 0 + δ 0d2 + β 1dT + δ1d2.dT + other factors [13.10]

di mana y adalah variabel hasil yang menarik. Seperti dalam Contoh 13.3,

mengukur dampak kebijakan. Tanpa faktor-faktor lain dalam regresi, akan


menjadi penaksir perbedaan-dalam-perbedaan:

[13.11]

di mana bilah menunjukkan rata-rata, subskrip pertama menunjukkan tahun, dan


subskrip kedua menunjukkan grup. Pengaturan umum perbedaan-perbedaan

ditunjukkan pada Tabel 13.3. Tabel 13.3 menunjukkan bahwa parameter , kadang-
kadang disebut efek perlakuan rata-rata (karena mengukur efek "perlakuan" atau
kebijakan terhadap hasil rata-rata y), dapat diperkirakan dengan dua cara: (1) Hitung
perbedaan dalam rata-rata antara kelompok perlakuan dan kontrol dalam setiap
periode waktu, dan kemudian bedakan hasilnya dari waktu ke waktu; ini seperti dalam
persamaan (13.11); (2) Hitung perubahan rata-rata dari waktu ke waktu untuk masing-
masing kelompok perlakuan dan kontrol, dan kemudian bedakan perubahan ini, yang

berarti kita cukup menuliskan . Secara alami,

estimasi tidak tergantung pada bagaimana kita melakukan pembedaan, seperti


yang terlihat oleh penataan ulang sederhana.

Ketika variabel penjelas ditambahkan ke persamaan (13.10) (untuk mengontrol fakta


bahwa populasi sampel dapat berbeda secara sistematis selama dua periode), estimasi

OLS untuk tidak lagi memiliki bentuk sederhana (13,11), tetapi interpretasinya
serupa.

17
Example 13.4 Effect of Worker Compensation Laws on Weeks out of Work
(Pengaruh Undang-undang Kompensasi Pekerja pada Minggu-Minggu
Kehilangan Pekerjaan)

Meyer, Viscusi, dan Durbin (1995) (selanjutnya, MVD) mempelajari lamanya


waktu (dalam beberapa minggu) bahwa seorang pekerja yang terluka menerima
kompensasi pekerja. Pada 15 Juli 1980, Kentucky mengangkat batas atas penghasilan
mingguan yang ditanggung oleh kompensasi pekerja. Peningkatan tutup tidak
berdampak pada manfaat bagi pekerja berpenghasilan rendah, tetapi membuatnya lebih
murah bagi pekerja berpenghasilan tinggi untuk tetap pada kompensasi pekerja. Oleh
karena itu, kelompok kontrol adalah pekerja berpenghasilan rendah, dan kelompok
perlakuan adalah pekerja berpenghasilan tinggi; pekerja berpenghasilan tinggi
didefinisikan sebagai mereka yang dikenai batasan perubahan pra-kebijakan. Dengan
menggunakan sampel acak baik sebelum maupun setelah perubahan kebijakan, MVD
dapat menguji apakah kompensasi pekerja yang lebih dermawan menyebabkan orang
tidak lagi bekerja (semuanya tetap). Mereka mulai dengan analisis perbedaan-dalam-
perbedaan, menggunakan log (durat) sebagai variabel dependen. Biarkan afchnge
menjadi variabel dummy untuk pengamatan setelah perubahan kebijakan dan pelajari
variabel dummy untuk berpenghasilan tinggi. Menggunakan data dalam CEDERA,
persamaan estimasi, dengan kesalahan standar dalam tanda kurung, adalah

[13.12]

Oleh karena itu, , yang menyiratkan bahwa lama waktu rata-


rata pada kompensasi pekerja untuk pekerja berpenghasilan tinggi meningkat sekitar
19% karena peningkatan tutup pendapatan. Koefisien pada afchnge kecil dan tidak
signifikan secara statistik: seperti yang diharapkan, kenaikan tutup pendapatan tidak
berpengaruh pada durasi pekerja berpenghasilan rendah.

Ini adalah contoh yang baik tentang bagaimana kita bisa mendapatkan
perkiraan yang cukup tepat tentang dampak perubahan kebijakan meskipun kita tidak
bisa menjelaskan banyak variasi dalam variabel dependen. Variabel dummy dalam
(13.12) hanya menjelaskan 2.1% dari variasi dalam log (durat). Ini masuk akal: jelas
18
ada banyak faktor, termasuk parahnya cedera, yang memengaruhi berapa lama
seseorang menerima kompensasi pekerja. Untungnya, kami memiliki ukuran sampel
yang sangat besar, dan ini memungkinkan kami untuk mendapatkan statistik t yang
signifikan. MVD juga menambahkan berbagai kontrol untuk jenis kelamin, status
perkawinan, usia, industri, dan jenis cedera. Hal ini memungkinkan fakta bahwa jenis
orang dan jenis cedera mungkin berbeda secara sistematis dengan kelompok
pendapatan selama dua tahun. Mengontrol faktor-faktor ini ternyata tidak banyak

berpengaruh pada perkiraan . (Lihat Latihan Komputer C4.)

Kadang-kadang, kedua kelompok terdiri dari orang-orang yang tinggal di dua


negara tetangga di Amerika Serikat. Misalnya, untuk menilai dampak perubahan pajak
rokok pada konsumsi rokok, kita dapat memperoleh sampel acak dari dua negara
bagian selama dua tahun. Di Negara A, kelompok kontrol, tidak ada perubahan dalam
pajak rokok. Di Negara B, kelompok perlakuan, pajak meningkat (atau menurun) antara
dua tahun. Variabel hasil akan menjadi ukuran konsumsi rokok, dan persamaan (13.10)
dapat diperkirakan untuk menentukan pengaruh pajak terhadap konsumsi rokok. Untuk
survei yang menarik tentang metodologi eksperimen alami dan beberapa contoh
tambahan, lihat Meyer (1995).

2.3 Two-Period Panel Data Analysis (Analisis Data Panel Dua

Periode)

Beralih ke analisis jenis yang paling sederhana dari data panel untuk
penampang individu, sekolah, perusahaan, kota, dan yang lainnya, kami memiliki dua
tahun data yaitu, t = 1 dan t = 2. Tahun-tahun ini tidak perlu berdekatan, tapi t = 1
berkorespondensi dengan tahun sebelumnya. Sebagai contoh, data CRIME2 memuat
data tingkat kejahatan dan pengangguran di 46 kota untuk tahun 1982 dan tahun 1987.
Oleh karena itu, t = 1 berkorespondensi dengan tahun 1982, dan t = 2
berkorespondensi dengan tahun 1987. Jika kita menggunakan persilangan data (cross
section) tahun 1987 dan melakukan regresi sederhana dari crmrte dan unem maka
diperoleh :

19
Jika ditafsirkan maka diperkirakan persamaan ini menunjukkan bahwa
peningkatan tingkat pengangguran menurunkan tingkat kejahatan. Hal ini tentunya
tidak seperti apa yang diharapkan. Koefisien pada unem tidak signifikan secara
statistik pada tingkat signifikansi standar.

Persamaan regresi sederhana ini mungkin akan mengalami masalah variabel


yang dihilangkan. Salah satu solusi yang mungkin adalah mencoba untuk
mengendalikan beberapa faktor, seperti distribusi usia, distribusi jenis kelamin,
tingkat pendidikan, upaya penegakan hukum, dan sebagainya dalam analisis regresi
berganda. Tetapi banyak faktor yang mungkin akan sulit untuk dikontrol.

Cara alternatif untuk menggunakan data panel adalah dengan melihat faktor-
faktor tidak teramati yang mempengaruhi variabel dependen yang terdiri dari dua
jenis yaitu, yang konstan dan yang bervariasi dari waktu ke waktu. Hal tersebut dapat
ditulis dengan model :

Pada model di atas, i menunjukkan orang, perusahaan, kota, dan sebagainya,


dan t menunjukkan jangka waktu. Variabel δ2 adalah variabel dummy yang sama
dengan nol (0) ketika t = 1 dan satu (1) ketika t = 2. Hal tersebut tidak berubah pada i,
itulah sebabnya variabel δ2 tidak memiliki subskrip i. Oleh karena itu, intersep untuk
t = 1 adalah β 0, dan intersep untuk t = 2 adalah β 0 + δ 0. Dalam contoh, tren sekuler di
Amerika Serikat akan menyebabkan tingkat kejahatan di seluruh kota AS berubah
mungkin nyata selama periode lima tahun. Variabel αi menangkap semua faktor yang
tidak teramati, faktor waktu yang konstan yang mempengaruhi γ it. Secara generik, αi
disebut unobserved effect (efek yang tidak teramati). Hal serupa juga terjadi dalam
pekerjaan terapan untuk menemukan αi yang disebut sebagai fixed effect (efek tetap),
yang membantu mengingat bahwa αi diperbaiki dari waktu ke waktu. Model di atas
(13.13) disebut unobserved effect model atau fixed effect model. Dalam aplikasi dapat
dilihat bahwa αi disebut sebagai heterogenitas yang tidak teramati (heterogenitas
individu, heterogenitas perusahaan, heterogenitas kota, dan sebagainya).

20
Error U it sering disebut idiosyncratic error atau time-varying error (kesalahan
waktu bervariasi), karena itu mewakili faktor yang tidak teramati yang berubah
seiring waktu dan memengaruhi γ it.

Sebuah unobserved effect model (model efek yang tidak teramati) sederhana
untuk tingkat kejahatan kota pada tahun 1982 dan tahun 1987 adalah :

Di mana δ87 adalah variabel dummy untuk tahun 1987. Karena i


menunjukkan kota yang berbeda, kita sebut αi sebagai unobserved city effect (efek
kota yang tidak teramati) atau a city fixed effect (efek tetap kota), itu mewakili semua
faktor yang mempengaruhi tingkat kejahatan kota yang tidak berubah dari waktu ke
waktu. Fitur geografis, seperti lokasi kota di Amerika Serikat, termasuk dalam αi.
Banyak faktor lain yang mungkin tidak persis konstan, tetapi faktor tersebut kira-kira
konstan selama periode lima tahun. Ini mungkin termasuk fitur tertentu demografi
penduduk (usia, ras, dan pendidikan). Kota yang berbeda mungkin memiliki metode
sendiri untuk melaporkan kejahatan, dan orang-orang yang tinggal di kota-kota
tersebut mungkin memiliki sikap yang berbeda terhadap kejahatan.

Satu kemungkinan untuk memperkirakan parameter penting, β 1 dengan


mengingat dua tahun data panel adalah mengumpulkan dua tahun data dan
menggunakan OLS. Yang paling penting adalah agar OLS yang dikumpulkan dapat
menghasilkan estimator yang konsisten dari β 1, kita harus mengasumsikan bahwa
unobserved effect (efek yang tidak teramati), αi , tidak berkorelasi dengan χ it.

Kita dapat dengan mudah melihat ini dengan menulis (13.13) sebagai :

di mana V it = αi + U it sering disebut composite error (kesalahan gabungan). Dari apa


yang diketahui tentang OLS, harus diasumsikan bahwa V it berkorelasi dengan χ it, di
mana t = 1 atau 2, untuk OLS memperkirakan β 1 (dan parameter lainnya secara
konsisten). Hal ini berlaku bila kita menggunakan single cross section atau two cross
sections. Oleh karena itu, jika kita menganggap bahwa idiosyncratic error U it
berkorelasi dengan χ it, OLS yang dikumpulkan bias dan tidak konsisten jika αi dan χ it

21
berkorelasi. Bias yang dihasilkan OLS kadang-kadang disebut heterogenitas bias, tapi
itu benar-benar hanya bias yang disebabkan dari menghilangkan time-constant
variable (variabel waktu-konstan). Untuk menggambarkan apa yang terjadi, kami
menggunakan data dalam CRIME2 untuk memperkirakan (13.14) dengan
menggabungkan OLS. Sejak ada 46 kota dan dua tahun untuk masing-masing kota,
ada 92 total pengamatan:

Koefisien pada unem, meskipun positif dalam (13.16) tetapi memiliki t


statistik yang sangat kecil. Dengan demikian, menggunakan OLS yang dikumpulkan
pada dua tahun tidak memecahkan masalah variabel yang dihilangkan.

Dalam sebagian besar aplikasi, alasan utama untuk mengumpulkan data panel
adalah untuk memungkinkan unobserved effect (efek yang tidak teramati), αi, untuk
berkorelasi dengan explanatory variables (variabel penjelas). Lebih tepatnya dapat
dituliskan :

Jika kita kurangi persamaan pertama dengan persamaan kedua, kita


dapatkan :

atau

di mana Δ menunjukkan perubahan dari t = 1 ke t = 2.

Persamaan (13.17), yang disebut persamaan first-differenced, sangat


sederhana. Ini hanya persamaan cross-sectional, tetapi masing-masing variabel
dibedakan dari waktu ke waktu. Yang paling penting dari ini adalah bahwa ΔU i

22
berkorelasi dengan Δ χ i. Asumsi ini berlaku jika idiosnycratic error dalam t, U it, tidak
berkorelasi dengan explanatory variable (variabel penjelas) di kedua periode waktu.

Sebagai contoh, anggaplah upaya penegakan hukum meningkat lebih banyak


di kota-kota di mana tingkat pengangguran menurun. Hal ini dapat menyebabkan
korelasi negatif antara ΔU i dan Δunemi, yang kemudian akan menyebabkan bias
dalam estimator OLS . Tentu, masalah ini dapat diatasi sampai batas tertentu dengan
memasukkan lebih banyak faktor dalam persamaan.

Satu-satunya asumsi lain yang berlaku untuk OLS statistik biasa adalah bahwa
(13.17) memenuhi asumsi homoskedastisitas. Ketika kami memperkirakan (13.17)
untuk contoh tingkat kejahatan, kami dapatkan :

yang sekarang
memberikan
hubungan positif dan signifikan secara statistik antara kejahatan dan pengangguran.

Sedikit variasi dalam Δ χ i dapat menyebabkan large standard error untuk β 1


ketika memperkirakan (13.17) dari OLS. Kita dapat memerangi ini dengan
menggunakan large cross section. Selain itu kita dapat menggunakan perubahan dari
waktu ke waktu yang kadang lebih baik daripada menggunakan perubahan dari tahun-
ke-tahun.

Sebagai contoh, mempertimbangkan masalah kembali ke pendidikan


menggunakan data panel pada individu selama dua tahun. Model yang di dapat
adalah:

di mana αi mengandung unobserved ability (kemampuan yang tidak teramati) yang


mungkin berkorelasi dengan educit (pendidikan). Persamaan dalam perbedaan pertama
adalah :

23
kita dapat memperkirakan ini dengan OLS. Masalahnya adalah kita tertarik pada
orang dewasa yang bekerja, dan menurut sebagian besar individu yang dipekerjakan
pendidikan tidak berubah seiring waktu. Jika hanya sebagian kecil dari sampel Δ educi
berbeda dari nol, akan sulit untuk mendapatkan estimator tepat β 1 dari (13.19), kecuali
kita memiliki ukuran sampel yang agak besar. Secara teori, menggunakan persamaan
first-differenced untuk memperkirakan masalah kembali ke pendidikan adalah ide
yang bagus, tetapi tidak bekerja dengan baik untuk sebagian besar set data panel yang
tersedia saat ini.

Menambahkan beberapa variabel penjelas tidak menyebabkan kesulitan. Kita


mulai dengan unobserved effects model (model efek yang tidak teramati) :

untuk t = 1 dan 2. Persamaan ini terlihat lebih rumit karena masing-masing variabel
penjelas memiliki tiga subskrip. Yang pertama menunjukkan nomor pengamatan
cross-sectional, yang kedua menunjukkan periode waktu, dan yang ketiga hanyalah
label variabel.

CONTOH 13.5 "Sleeping versus Working"

Kami menggunakan dua tahun data panel di SLP75_81, dari Biddle dan
Hamermesh (1990), untuk memperkirakan tradeoff antara tidur dan bekerja. Pada
masalah 3 dalam Bab 3, kami hanya menggunakan cross-section (persilangan data)
tahun 1975. Kumpulan data panel yang ditetapkan untuk tahun 1975 dan tahun 1981
memiliki 239 orang, yang jauh lebih kecil dari tahun 1975 yang mencakup lebih dari
700 orang. Unobserved effects model (model efek yang tidak teramati) untuk total
menit tidur per minggu adalah :

Unobserved effects (efek yang tidak teramati), αi, akan disebut unobserved individual
effect atau an individual fixed effect. Sangat penting untuk memungkinkan αi
dikorelasikan dengan totwrkitit. Beberapa orang mempunyai lebih banyak energi, ini
menyebabkan mereka kurang tidur dan lebih banyak bekerja. Variabel educ adalah
pendidikan, marr adalah variabel dummy pernikahan, yngkid adalah variabel dummy

24
yang menunjukkan adanya anak kecil, dan gdhlth adalah variabel dummy kesehatan.
Dari perbedaan tersebut di dapat persamaan :

Dengan asumsi bahwa idiosyncratic error, ΔU i, tidak berkorelasi dengan perubahan


dalam semua variabel penjelas, kita bisa mendapatkan estimator yang konsisten
menggunakan OLS. Hal ini memberikan :

Koefisien pada Δtotwrk menunjukkan tradeoff antara tidur dan bekerja dengan
faktor-faktor lain tetap, satu jam pekerjaan dikaitkan dengan 0,227(60) = 13,62 lebih
sedikit menit tidur.t statistik (−6,31) sangat signifikan. Tidak ada perkiraan lain,
kecuali intersep yang berbeda secara statistik dari nol. Uji F untuk signifikansi dari
semua variabel kecuali Δtotwrk memberikan p-value = 49, yang berarti secara
serentak tidak signifikan.

Kesalahan standar pada Δeduc relatif besar terhadap perkiraan. Ini adalah
fenomena yang dijelaskan sebelumnya untuk persamaan upah. Dalam sampel 239
orang, 76,6% (183 orang) tidak memiliki perubahan pendidikan selama periode enam
tahun, dan 90% orang memiliki perubahan dalam pendidikan paling banyak satu
tahun.

Data panel juga dapat digunakan untuk memperkirakan lag models


terdistribusi. Bahkan jika kita menentukan persamaannya untuk dua tahun, kita perlu
mengumpulkan lebih banyak tahun data untuk mendapatkan explanatory variable
(variabel penjelas). Berikut ini adalah contoh sederhana:

CONTOH 13.6 "Distributed Lag of Crime Rate on Clear-Up Rates"

Eide (1994) menggunakan data panel dari distrik kepolisian di Norwegia untuk
memperkirakan lag models terdistribusi untuk tingkat kejahatan. Variabel penjelas
25
tunggal adalah "clear-up percentage" (clrprc) - persentase kejahatan yang
menyebabkan hukuman. Data tingkat kejahatan berasal dari tahun 1972 dan tahun
1978. Mengikuti Eide, kami ketinggalan waktu clrprc selama satu dan dua tahun: ada
kemungkinan bahwa clear-up lalu memiliki efek jera pada tingkat kejahatan. Ini
mengarah pada unobserved effects model (model efek yang tidak teramati) untuk dua
tahun :

Ketika membedakan persamaan dan memperkirakannya menggunakan data


dalam CRIME3, didapatkan :

Lag kedua negatif dan signifikan secara statistik, yang menyiratkan bahwa
persentase clear-up yang lebih tinggi dua tahun lalu akan mencegah kejahatan tahun
ini. Secara khusus, peningkatan 10 poin persentase dalam clrprc dua tahun lalu akan
menyebabkan penurunan 13,2% dalam tingkat kejahatan tahun ini. Ini menunjukkan
hal itu menggunakan lebih banyak sumber daya untuk menyelesaikan kejahatan dan
mendapatkan hukuman dapat mengurangi kejahatan di masa depan.

2.3a. Organizing Panel Data (Mengatur Data Panel)


Dalam menggunakan data panel dalam studi ekonometrika, penting untuk
mengetahui bagaimana data harus disimpan. Kita harus berhati-hati untuk mengatur
data sehingga periode waktu yang berbeda untuk unit cross-sectional yang sama
(orang, perusahaan, kota, dan sebagainya) mudah dihubungkan. Untuk konkrit,
anggaplah bahwa data set di kota selama dua tahun yang berbeda. Untuk sebagian
besar tujuan, cara terbaik untuk memasukkan data adalah memiliki dua catatan untuk
setiap kota dimana catatan pertama untuk setiap kota bersesuaian dengan awal tahun,
dan catatan kedua adalah untuk tahun kemudian. Kedua catatan harus berdekatan.
Oleh karena itu, satu set data untuk 100 kota dan dua tahun akan berisi 200 catatan.
Dua catatan pertama adalah untuk kota pertama dalam sampel, dua catatan berikutnya
adalah untuk kota kedua, dan seterusnya. Hal ini memudahkan untuk membangun

26
perbedaan untuk menyimpan ini dalam catatan kedua untuk masing-masing kota dan
mengumpulkan analisis cross-sectional yang dapat dibandingkan dengan differencing
estimation (estimasi perbedaan).

Sebagian besar dua periode data panel set yang menyertai teks ini disimpan
dengan cara ini (misalnya, CRIME2, CRIME3, GPA3, LOWBRTH, dan RENTAL).

Kami menggunakan perpanjangan langsung dari skema ini untuk set data panel
dengan lebih dari dua periode waktu.

Cara kedua mengatur dua periode dari data panel adalah untuk memiliki hanya
satu record per unit cross sectional. Hal ini membutuhkan dua entri untuk setiap
variabel, satu untuk setiap periode waktu. Data panel di SLP75_81 diatur dengan cara
ini. Setiap individu memiliki data pada variabel slpnap75, slpnap81, totwrk75,
totwrk81, dan sebagainya. Membuat perbedaan antara tahun 1975-1981 adalah hal
mudah. Panel data lain dengan struktur ini adalah TRAFFIC1 dan VOTE2. Namun,
menempatkan data dalam satu catatan tidak memungkinkan analisis OLS yang
dikumpulkan menggunakan dua periode waktu pada data asli. Metode ini juga tidak
berfungsi untuk kumpulan data panel dengan lebih dari dua periode waktu.

2.4 Analisis kebijakan dengan Dua Periode data Panel

Panel Data set sangat berguna untuk analisis kebijakan dan, khususnya
evaluasi program. Dalam sederhana pengaturan evaluasi program, sampel individu,
perusahaan, kota, dan sebagainya, diperoleh pada periode pertama kalinya. Hal ini
mirip dengan literatur percobaan alami yang dibahas sebelumnya, dengan satu
perbedaan penting: sama unit cross-sectional muncul dalam setiap periode waktu.

Sebagai contoh, misalkan kita ingin mengevaluasi efek dari program pelatihan
kerja Michigan pada produktivitas pekerja dari perusahaan manufaktur (lihat juga
Latihan Komputer C3) dalam Bab 9. Pada scrapit menunjukkan tingkat scrap
perusahaan i selama tahun t ( jumlah item per 100, yang harus dihapus karena cacat).

27
Membiarkan grantit menjadi indikator biner sama dengan satu jika perusahaan i di
tahun t menerima hibah pelatihan kerja. Untuk tahun 1987 dan 1988, model ini

dimana y88t adalah variabel dummy untuk tahun 1988 dan α 1 adalah efek perusahaan
tidak teramati atau mengencangkan efek tetap. Efek teramati mengandung faktor-
faktor seperti kemampuan rata-rata karyawan, modal, dan keterampilan manajerial; ini
kira-kira konstan selama periode dua tahun. Dan α1 secara sistematis terkait dengan
apakah perusahaan menerima hibah. Sebenarnya, dalam program khusus ini, dana
tersebut diberikan pada pertama-datang. Tapi apakah perusahaan diterapkan pada awal
untuk hibah dapat berkorelasi dengan produktivitas pekerja. Dalam hal ini, analisis
menggunakan penampang tunggal atau hanya penyatuan seorang dari penampang akan
menghasilkan bias dan estimator tidak konsisten.

Persamaan untuk menghapus α1 adalah

Oleh karena itu, kita hanya mundur perubahan dalam tingkat memo pada
perubahan indikator hibah. Karena tidak ada perusahaan menerima hibah pada tahun
1987, granti1 = 0 untuk semua i, dan ∆ grant i = granti2 – granti1 = granti2, yang hanya
menunjukkan apakah perusahaan menerima hibah pada tahun 1988. Namun, secara

umum penting untuk perbedaan semua variabel (termasuk variabel dummy) karena ini
diperlukan untuk menghilangkan α1 dalam model efek teramati (13.23).

Memperkirakan persamaan pertama-dibedakan dengan menggunakan data


dalam JTRAIN memberikan

28
Oleh karena itu, kami memperkirakan bahwa memiliki hibah pelatihan kerja
menurunkan tingkat memo rata-rata sebesar -.739. Tapi perkiraan secara statistik tidak
berbeda dari nol.
Kami mendapatkan hasil yang lebih kuat dengan menggunakan log(scrap) dan
memperkirakan efek persentase:

Memiliki hibah pelatihan kerja diperkirakan menurunkan tingkat memo sekitar 27,2%.
[Kami memperoleh perkiraan ini dari persamaan (7.10): exp(-.317) – 1 ≈ -.272].
Untuk t statistik adalah tentang -1.93, yang merupakan sedikit signifikan. Sebaliknya,
menggunakan pooled OLS dari log (scrap) di y88 dan hibah memberikan ^β 1 = .057
(standard error = .431). Dengan demikian, kita menemukan ada hubungan yang
signifikan antara tingkat memo dan hibah pelatihan kerja. Sejak berbeda ini begitu
banyak dari perkiraan pertama-perbedaan, itu menunjukkan bahwa perusahaan yang
memiliki pekerja-kemampuan yang lebih rendah lebih mungkin untuk menerima
hibah.

Hal ini berguna untuk mempelajari model evaluasi program yang lebih umum.

Membiarkan yit menunjukkan variabel hasil dan membiarkan progit menjadi variabel
dummy partisipasi program. Model efek tidak teramati paling sederhana adalah

Jika partisipasi program hanya terjadi pada periode kedua, maka OLS estimator β 1
dalam persamaan dibedakan memiliki representasi yang sangat sederhana:

Artinya, kita menghitung rata-rata perubahan y selama dua periode waktu untuk
pengobatan dan kelompok kontrol. Kemudian, ^β 1 perbedaan ini. Ini adalah versi data
panel dari perbedaan-pengabaian estimator dalam persamaan (13.11) selama dua

29
pengumpulan perpotongan. Dengan data panel, kami memiliki keuntungan potensial
penting: kita dapat perbedaan y di waktu untuk sama unit cross-sectional. Hal ini
memungkinkan kita untuk kontrol untuk seseorang-, perusahaan-, atau efek kota-
spesifik, sebagai model di (13.25) membuat jelas.

Metode differencing sama bekerja untuk menganalisis efek dari setiap


kebijakan yang bervariasi di seluruh kota atau negara. Berikut ini adalah contoh
sederhana.

Contoh 13.7 Pengaruh hukum Drunk Driving tentang Lalu Lintas


Kematian

Banyak negara di Amerika Serikat telah mengadopsi kebijakan yang berbeda


dalam upaya untuk mengekang mengemudi dalam keadaan mabuk. Dua jenis undang-
undang yang akan kita pelajari disini adalah terbuka kontainer laws- yang
membuatnya ilegal bagi penumpang untuk memiliki wadah terbuka alkohol minuman-
dan administrasi per se laws- yang memungkinkan pengadilan untuk menangguhkan
lisensi setelah sopir ditangkap karena mengemudi dalam keadaan mabuk tapi sebelum
pengemudi dihukum. Salah satu analisis yang mungkin adalah dengan menggunakan
satu bagian lintas negara untuk regresi mengemudi korban jiwa (atau yang terkait
dengan mengemudi dalam keadaan mabuk) pada indikator variabel dummy untuk
apakah setiap hukum hadir. Ini tidak mungkin untuk bekerja dengan baik karena
negara memutuskan, melalui proses legislatif, apakah mereka perlu undang-undang
tersebut. Oleh karena itu, kehadiran undang-undang kemungkinan akan terkait dengan
rata-rata mabuk mengemudi korban jiwa dalam beberapa tahun terakhir. Analisis yang
lebih meyakinkan menggunakan data panel selama periode waktu di mana beberapa
negara menerapkan undang-undang baru (dan beberapa negara mungkin telah dicabut
hukum yang ada). File TRAFFIC1 berisi data untuk tahun 1985 dan 1990 untuk semua
50 negara bagian dan District of Columbia. dthrte). Pada tahun 1985, 19 negara
memiliki undang-undang wadah terbuka, sementara 22 negara memiliki undang-
undang tersebut pada tahun 1990. Pada tahun 1985, 21 negara telah per se hukum;
jumlah ini telah berkembang menjadi 29 pada tahun 1990.

30
Menggunakan OLS setelah differencing pertama memberikan

Perkiraan menunjukkan bahwa mengadopsi hukum wadah terbuka


menurunkan tingkat kematian lalu lintas dengan 0,42, efek trivial mengingat bahwa
tingkat kematian rata-rata pada tahun 1985 adalah 2,7 dengan standar deviasi sekitar
0,6. Perkiraan tersebut secara statistik signifikan pada tingkat 5% terhadap alternatif
dua sisi.

2.5 Differencing dengan Lebih Dari Dua Periode Waktu

Untuk ilustrasi, misalkan kita memiliki N individu dan T = 3 periode waktu


untuk setiap individu. Model efek tetap umum

untuk t = 1, 2, dan 3. (Jumlah pengamatan karena itu 3N.) Perhatikan bahwa kita

sekarang termasuk dua dummies waktu selain intercept. Ini adalah ide yang baik
untuk memungkinkan intercept terpisah untuk setiap periode waktu, terutama ketika
kita memiliki sejumlah kecil dari mereka. Periode dasar, seperti biasa, adalah t = 1.
Intercept untuk periode kedua kalinya adalah δ1 + δ2, dan seterusnya.
Asumsi utama adalah bahwa error istimewa tidak berkorelasi dengan variabel
penjelas dalam setiap periode waktu:
Artinya, variabel penjelas yang ketat eksogen setelah kami mengambil efek tidak
teramati, α1. (Asumsi exogeneity ketat dinyatakan dalam hal harapan bersyarat nol
diberikan dalam lampiran bab.) Asumsi (13.29) aturan keluar kasus di mana masa
depan variabel penjelas bereaksi terhadap perubahan arus dalam kesalahan istimewa,

karena harus menjadi kasus jika xitj adalah variabel dependen tertinggal. Jika kita telah
dihilangkan variabel waktu bervariasi penting, maka (13,29) umumnya dilanggar.

31
Jika α1 berkorelasi dengan xitj, kemudian xitj akan berkorelasi dengan gabungan error,
vit = α1 + uit, bawah (13,29). Kami dapat menghilangkan α 1 oleh differencing periode
yang berdekatan. Dalam T = 3 kasus, kita kurangi waktu satu periode dari waktu
periode dua dan jangka waktu dua dari waktu periode tiga. Hal ini memberikan

untuk t = 2 dan 3. Kami tidak memiliki persamaan dibedakan untuk t = 1 karena tidak
ada yang dikurangi dari t = 1 persamaan. Sekarang, (13.30) merupakan dua periode
waktu untuk setiap individu dalam sampel. Jika persamaan ini memenuhi asumsi
model linier klasik, OLS kemudian dikumpulkan memberikan berisi penduga, dan
biasa t dan F Statistik berlaku untuk hipotesis. Kami juga dapat menarik hasil
asimtotik.
Oleh karena itu, (13.30) tidak berisi intercept. Hal ini nyaman untuk tujuan
tertentu, termasuk perhitungan R kuadrat. Kecuali penyadapan waktu dalam model
asli (13.28) adalah bunga langsung -mereka jarang-lebih baik untuk memperkirakan
persamaan pertama-dibedakan dengan intercept dan satu periode waktu dummy,
biasanya untuk periode ketiga. Dengan kata lain, persamaan menjadi

Perkiraan dari βj identik baik formulasi. Dengan lebih dari tiga periode waktu,
hal serupa. Jika kita memiliki yang sama T periode waktu untuk masing-masing N unit
cross-sectional, kita katakan bahwa data set adalah panel seimbang: kami memiliki
periode waktu yang sama untuk semua individu, perusahaan, kota, dan sebagainya.
Kapan T relatif kecil dibandingkan N, kita harus mencakup variabel dummy untuk
setiap periode waktu untuk account untuk perubahan sekuler yang tidak dimodelkan.

Oleh karena itu, setelah differencing pertama, persamaan terlihat seperti


di mana kita memiliki T - 1 kali periode pada setiap unit i untuk persamaan pertama-
dibedakan. Jumlah pengamatan adalah N(T – 1).

32
Contoh 13.8 Pengaruh Enterprise Zona di Klaim Pengangguran

Papke (1994) meneliti efek dari (EZ) Program zona perusahaan Indiana pada
klaim pengangguran. Dia menganalisis 22 kota di Indiana selama periode dari tahun
1980 sampai 1988. Enam zona perusahaan yang ditunjuk pada tahun 1984, dan empat
lagi ditugaskan pada tahun 1985. Dua belas dari kota dalam sampel tidak menerima
zona perusahaan selama periode ini; mereka menjabat sebagai kelompok kontrol.

Sebuah model evaluasi kebijakan sederhana adalah

dimana uclmsit adalah jumlah klaim pengangguran yang diajukan selama tahun t di
kota i. parameter θt hanya menunjukkan intercept berbeda untuk setiap periode waktu.
Umumnya, klaim pengangguran jatuh di seluruh negara bagian selama periode ini,
dan ini harus tercermin dalam penyadapan tahun yang berbeda. Variabel biner ez it
sama dengan satu jika kota i pada waktu t adalah zona perusahaan; kita tertarik di β1.
Efek teramati α1 merupakan faktor tetap yang mempengaruhi iklim ekonomi di kota i.
Karena zona perusahaan penunjukan tidak ditentukan secara acak-perusahaan zona
biasanya ekonomis tertekan daerah-ada kemungkinan bahwa ezit dan α1 berkorelasi
positif (tinggi α1 berarti lebih tinggi klaim pengangguran, yang menyebabkan
kesempatan yang lebih tinggi yang diberikan EZ). Dengan demikian, kita harus
perbedaan persamaan untuk menghilangkan α1:

Variabel dependen dalam persamaan ini, perubahan log (uclms it) adalah tingkat
pertumbuhan tahunan perkiraan klaim pengangguran dari tahun t - 1 untuk t. Kita bisa
memperkirakan persamaan ini untuk tahun 1981-1988 dengan menggunakan data
dalam EZUNEM; ukuran sampel total 22·8 = 176. Perkiraan β1 adalah ^β 1 = -.182
(standard error = .078). Oleh karena itu, tampak bahwa kehadiran EZ menyebabkan

sekitar 16,6% [exp(-.182) - 1 ≈ -.166] jatuh klaim pengangguran. Ini adalah efek
ekonomi yang besar dan signifikan secara statistik.

Contoh 13.9 County Kejahatan Tarif di North Carolina

33
Cornwell dan Trumbull (1994) menggunakan data 90 kabupaten di North
Carolina, untuk tahun 1981 melalui 1987, untuk memperkirakan model efek tidak
teramati kejahatan; data yang terkandung dalam CRIME4. Di sini, kami
memperkirakan versi sederhana dari model mereka, dan kami perbedaan persamaan
dari waktu ke waktu untuk menghilangkan α1, efek tidak teramati. (Cornwell dan
Trumbull menggunakan transformasi yang berbeda, yang akan kita bahas pada Bab
14.) Berbagai faktor termasuk lokasi geografis, sikap terhadap kejahatan, catatan
sejarah, dan konvensi melaporkan mungkin terkandung dalam α1. Tingkat kejahatan
jumlah kejahatan per orang, prbarr adalah estimasi probabilitas penangkapan, prbconv
adalah estimasi probabilitas keyakinan (diberikan penangkapan), prbpris adalah
probabilitas menjalani hukuman di penjara (diberikan keyakinan), avgsen adalah rata-
rata panjang kalimat disajikan, dan polpc adalah jumlah polisi per kapita. Seperti
standar dalam studi kriminometri, kami menggunakan log dari semua variabel untuk
memperkirakan elastisitas. Kami juga menyertakan set boneka tahun lengkap untuk
mengontrol tren tingkat kejahatan negara bagian. Kita dapat menggunakan tahun 1982
hingga 1987 untuk memperkirakan persamaan yang berbeda. Kuantitas dalam tanda
kurung adalah kesalahan standar OLS biasa; jumlah dalam tanda kurung adalah
kesalahan standar yang kuat untuk korelasi serial dan heteroskedastisitas::

Tiga variabel probabilitas — penangkapan, penghukuman, dan hukuman penjara —


semuanya memiliki tanda yang diharapkan, dan semuanya signifikan secara statistik.
Misalnya, peningkatan 1% dalam kemungkinan penangkapan diperkirakan akan

34
menurunkan tingkat kejahatan sekitar 0,33%. Variabel kalimat rata-rata menunjukkan
efek jera yang sederhana, tetapi tidak signifikan secara statistik

Dalam ilustrasi, kami telah observasi data selama tiga tahun dengan sampel
acak pada tahun 2000, 2002, dan 2004 dan adapun model spesifiknya

2.5a Potensi Perangkap dalam Data Panel Perbedaan Pertama


Di bagian ini dan sebelumnya, kami telah menyatakan bahwa membedakan
data panel dari waktu ke waktu, untuk menghilangkan efek tak teramati yang konstan
waktu, adalah metode yang berharga untuk mendapatkan efek sebab akibat. Namun
demikian, membedakan tidak lepas dari kesulitan. Kami telah membahas masalah
potensial dengan metode ini ketika variabel penjelas utama tidak banyak berubah dari
waktu ke waktu (dan metode ini tidak berguna untuk variabel penjelas yang tidak
pernah berubah dari waktu ke waktu). Sayangnya, bahkan ketika kami memiliki
variasi waktu yang cukup dalam x itj, estimasi first-differenced (FD) dapat
menimbulkan bias yang serius. Kami telah menyebutkan bahwa eksogenitas yang
ketat dari para regressor merupakan asumsi kritis.

35
BAB III

PENUTUP

3.1 Kesimpulan

Kami telah mempelajari metode untuk menganalisis kumpulan data


penampang dan panel yang dikumpulan secara
independen. Penampang independen muncul ketika sampel acak yang berbeda
diperoleh dalam periode waktu yang berbeda (biasanya bertahun-tahun). OLS
menggunakan data terkumpulan adalah metode estimasi terkemuka, dan
prosedur inferensi yang biasa tersedia, termasuk koreksi untuk
heteroskedastisitas. (Korelasi serial bukan masalah karena sampel independen
sepanjang waktu.) Karena dimensi rangkaian waktu, kita sering memungkinkan
penyadapan waktu yang berbeda. Kami mungkin juga berinteraksi dengan
dummies waktu dengan variabel kunci tertentu untuk melihat bagaimana mereka
telah berubah dari waktu ke waktu. Ini sangat penting dalam literatur evaluasi
kebijakan untuk eksperimen alam.
Kumpulan data panel digunakan semakin banyak dalam pekerjaan yang
diterapkan, terutama untuk analisis kebijakan. Ini adalah kumpulan data di mana
unit penampang yang sama diikuti dari waktu ke waktu. Kumpulan data panel
paling berguna saat mengontrol fitur yang tidak terenkripsi secara konstan
orang, perusahaan, kota, dan sebagainya yang menurut kami mungkin
berkorelasi dengan variabel penjelasan dalam model kami. Salah satu cara untuk
menghapus efek yang tidak terlayani adalah dengan membedakan data dalam
periode waktu yang berdekatan. Kemudian, analisis OLS standar tentang
perbedaan dapat digunakan. Menggunakan dua periode data menghasilkan
regresi penampang dari data yang di perbedaan. Prosedur inferensi yang biasa
secara asimptotis valid di bawah homoskedasticity; inferensi yang tepat
tersedia di bawah normalitas.
Selama lebih dari dua periode waktu, kita dapat menggunakan OLS
terkumpulan pada data yang di perbedaan; kita kehilangan periode pertama kali
karena perbedaan. Selain homoskedasticity, kita harus
berasumsi bahwa kesalahan yang di perbedaan secara serial tidak terkait untuk
menerapkan statistik t dan F yang biasa. (Lampiran bab berisi daftar asumsi
yang cermat.) Tentu saja, variabel apa pun yang konstan dari waktu ke waktu
keluar dari analisis.

36
DAFTAR PUSTAKA

M Wooldridge, Jeffrey. 2016. Introductory Econometrics-A Modern Approach :


South Western College Pub

37

Anda mungkin juga menyukai