Bab 1

Bab 1
1,2
Namun, interpretasi modern tentang regresi sangat
berbeda. Secara umum, kita
boleh bilang
Analisis regresi berkaitan dengan studi ketergantungan
satu variabel, yaitu
variabel dependen, pada satu atau lebih variabel
lainnya, variabel penjelas, dengan tujuan untuk
memperkirakan dan / atau memprediksi mean (populasi)
atau nilai rata-rata dari yang sebelumnya
nilai yang diketahui atau tetap (dalam sampel berulang)
dari yang terakhir.
Contoh
1. Pertimbangkan kembali hukum regresi universal Galton. Galton tertarik untuk

mencari tahu
mengapa ada stabilitas dalam distribusi ketinggian dalam suatu populasi. Tapi di
modern
Perhatian kita bukan dengan penjelasan ini melainkan dengan mencari tahu
bagaimana rata-rata
Tinggi perubahan anak laki-laki, mengingat tinggi ayah. Dengan kata lain,
perhatian kita adalah dengan memprediksi
Tinggi rata-rata anak laki-laki mengetahui ketinggian ayah mereka. Untuk melihat
bagaimana ini bisa
Bisa dilakukan, perhatikan Gambar 1.1, yaitu scatter diagram, atau scattergram.
Angka ini
menunjukkan distribusi ketinggian anak laki - laki dalam populasi hipotetis yang
sesuai dengan
diberikan atau nilai tetap tinggi ayah. Perhatikan bahwa sesuai dengan ketinggian
tertentu
Seorang ayah adalah rentang atau distribusi ketinggian anak laki-laki. Namun,
perhatikan bahwa meskipun
variabilitas tinggi anak laki-laki untuk nilai tertentu tinggi ayah, tinggi rata-rata
Anak laki-laki umumnya meningkat saat tinggi ayahnya meningkat. Untuk

menunjukkan ini dengan jelas, yang dilingkari
Salib pada gambar menunjukkan tinggi rata-rata anak yang sesuai dengan yang
diberikan
tinggi sang ayah Menghubungkan rata-rata ini, kita mendapatkan garis yang
ditunjukkan pada gambar. Ini
Garis, seperti yang akan kita lihat, dikenal sebagai garis regresi. Ini menunjukkan
bagaimana tinggi rata-rata
Anak laki-laki meningkat dengan tinggi ayahnya
2. Pertimbangkan scattergram pada Gambar 1.2, yang memberikan distribusi

secara hipotetis
populasi ketinggian anak laki-laki diukur pada usia tetap. Sesuai dengan usia
tertentu, kita
memiliki jangkauan, atau distribusi, ketinggian. Jelas, tidak semua anak laki-laki
dari usia tertentu cenderung melakukannya
memiliki ketinggian yang sama. Tapi tinggi rata-rata meningkat seiring

bertambahnya usia (tentu saja, sampai a
Hubungan Statistik versus Deterministik
Dari contoh yang dikutip di Bagian 1.2, pembaca akan memperhatikan bahwa
dalam analisis regresi
kita prihatin dengan apa yang dikenal sebagai statistik, tidak fungsional atau
deterministik,
ketergantungan antar variabel, seperti fisika klasik. Dalam hubungan statistik
Di antara variabel dasarnya kita berhadapan dengan variabel acak atau

stochastic4, yaitu,
variabel yang memiliki distribusi probabilitas. Dalam ketergantungan fungsional

atau deterministik,
Di sisi lain, kita juga berurusan dengan variabel, tapi variabel ini tidak acak atau
stochastic.
Ketergantungan hasil panen pada suhu, curah hujan, sinar matahari, dan pupuk,
untuk
Contohnya, bersifat statistik dalam arti bahwa variabel penjelasnya, walaupun
Yang pasti penting, tidak akan memungkinkan ahli agronomi memprediksi hasil
panen dengan tepat karena
kesalahan yang terlibat dalam mengukur variabel-variabel ini serta sejumlah

faktor lainnya (variabel)
yang secara kolektif mempengaruhi hasil tetapi mungkin sulit untuk diidentifikasi
secara individual. Jadi, ada
terikat untuk menjadi beberapa variabilitas "intrinsik" atau acak dalam variabel
tergantung hasil panen itu
tidak bisa sepenuhnya dijelaskan tidak peduli berapa banyak variabel penjelas
yang kita anggap.
Dalam fenomena deterministik, di sisi lain, kita berurusan dengan hubungan tipe,
katakanlah, dipamerkan oleh hukum gravitasi Newton, yang menyatakan: Setiap
partikel di alam semesta
Menarik setiap partikel lain dengan kekuatan yang berbanding lurus dengan
produk massa mereka
dan berbanding terbalik dengan kuadrat jarak di antara keduanya. Secara simbolis,
F = k (m1m2 / r 2), di mana F = force, m1 dan m2 adalah massa dari dua partikel, r
=
jarak, dan k = konstanta proporsionalitas. Contoh lain adalah hukum Ohm, yang
menyatakan:
Untuk konduktor logam pada kisaran suhu yang terbatas, C saat ini sebanding
dengan
tegangan V; yaitu, C = (1
k) V dimana 1
k adalah konstanta proporsionalitas. Contoh lainnya
Dari hubungan deterministik tersebut adalah hukum gas Boyle, undang-undang

listrik Kirchhoff, dan
Hukum gerak Newton.
Dalam teks ini kita tidak peduli dengan hubungan deterministik semacam itu.
Tentu saja jika
Ada kesalahan pengukuran, misalnya, dalam teori hukum gravitasi Newton,

sebaliknya
Hubungan deterministik menjadi hubungan statistik. Dalam situasi ini, kekuatan

bisa jadi
diprediksi hanya kira-kira dari nilai k (dan m1, m2, dan r) yang ada
kesalahan Variabel F dalam hal ini menjadi variabel acak.
Regresi versus Penyebab
Meskipun analisis regresi berhubungan dengan
ketergantungan satu variabel pada variabel lain,
Itu tidak selalu berarti sebab-akibat. Dalam kata-kata
Kendall dan Stuart, "statistik
hubungan, betapapun kuatnya dan betapapun sugestifnya,
tidak dapat membangun hubungan kausal:
Ide penyebab kita harus berasal dari statistik luar,
akhirnya dari beberapa teori
atau yang lain."
Dalam contoh hasil panen yang dikutip sebelumnya, tidak ada alasan statistik
untuk mengasumsikannya
curah hujan tidak tergantung pada hasil panen. Fakta bahwa kita memperlakukan
hasil panen sebagai tergantung pada
curah hujan (antara lain) adalah karena pertimbangan nonstatistik: akal sehat
menunjukkan bahwa hubungan tersebut tidak dapat dibalik, karena kita tidak
dapat mengendalikan curah hujan dengan cara yang bervariasi
hasil panen
Dalam semua contoh yang dikutip di Bagian 1.2, yang perlu diperhatikan adalah
hubungan statistik
Dengan sendirinya tidak bisa secara logis menyiratkan sebab-akibat. Untuk

menganggap kausalitas, seseorang harus naik banding ke apriori
atau pertimbangan teoretis. Jadi, dalam contoh ketiga dikutip, seseorang dapat
meminta ekonomi
Teori mengatakan bahwa pengeluaran konsumsi bergantung pada pendapatan riil.
Regresi versus Korelasi

Berkaitan erat tapi secara konseptual sangat berbeda dengan analisis regresi
Analisis korelasi, dimana tujuan utamanya adalah untuk mengukur kekuatan atau
derajat
hubungan linier antara dua variabel. Koefisien korelasi, yang akan kita dapatkan
belajar secara rinci di Bab 3, mengukur kekuatan asosiasi (linier) ini. Misalnya, kita
mungkin tertarik untuk menemukan korelasi (koefisien) antara merokok dan

kanker paru-paru,
antara skor statistik dan ujian matematika, antara nilai sekolah menengah
dan nilai kuliah, dan sebagainya. Dalam analisis regresi, seperti yang telah dicatat,
kita tidak terutama
tertarik pada ukuran seperti itu. Sebagai gantinya, kami mencoba memperkirakan
atau memprediksi nilai rata-rata
satu variabel berdasarkan nilai tetap variabel lainnya. Jadi, kita mungkin ingin tahu
apakah kita bisa memprediksi skor rata-rata pada pemeriksaan statistik dengan
mengetahui siswa
skor pada ujian matematika
Regresi dan korelasi memiliki beberapa perbedaan mendasar yang patut disebut.
Dalam analisis regresi ada suatu asimetri dengan cara yang dependen dan jelas
variabel diperlakukan. Variabel dependen diasumsikan bersifat statistik, acak, atau

stokastik,
yaitu, untuk memiliki distribusi probabilitas. Variabel penjelas, di sisi lain
tangan, diasumsikan memiliki nilai tetap (dalam sampling berulang), 7 yang dibuat
eksplisit di
definisi regresi yang diberikan pada Bagian 1.2. Jadi, pada Gambar 1.2 kita
mengasumsikan bahwa
Usia variabel ditetapkan pada tingkat yang ditentukan dan pengukuran tinggi
diperoleh pada saat ini
tingkat. Dalam analisis korelasi, di sisi lain, kita memperlakukan setiap (dua)
variabel secara simetris;
tidak ada perbedaan antara variabel dependen dan explanatory. Setelah semua,
korelasi antara skor pada matematika dan ujian statistik sama dengan itu
antara skor pada statistik dan ujian matematika. Apalagi kedua variabel tersebut
diasumsikan acak. Seperti yang akan kita lihat, sebagian besar teori korelasi
didasarkan pada
asumsi keacakan variabel, sedangkan sebagian besar teori regresi
diuraikan dalam buku ini tergantung pada asumsi bahwa variabel dependennya
adalah
stochastic namun variabel penjelasnya adalah fixed atau nonstochastic.8
Terminologi dan Notasi
Sebelum kita melanjutkan ke analisis formal teori regresi, mari kita tinggal
sebentar di
masalah terminologi dan notasi. Dalam literatur istilah dependen variabel dan
Variabel penjelas dijelaskan dengan berbagai cara. Daftar perwakilan adalah:
Variabel dependen Variabel penjelasan
Apakah ini?
Dijelaskan variabel Variabel Independen

Apakah ini?
Prediktor dan Prediktor
Apakah ini?
Regress dan Regressor
Apakah ini?
Respon Stimulus
Apakah ini?
Endogenous Exogenous
Apakah ini?
Hasil Kovariat
Apakah ini?
Variabel kontrol variabel terkontrol
Meski soal selera dan tradisi pribadi, dalam teks ini kita akan menggunakan
ketergantungan
variabel / variabel jelas atau terminologi regressand dan regressor yang lebih
netral.
Jika kita mempelajari ketergantungan variabel hanya pada satu variabel penjelas
tunggal,
seperti pengeluaran konsumsi untuk pendapatan riil, studi semacam itu dikenal
sederhana,
atau dua variabel, analisis regresi. Namun, jika kita mempelajari ketergantungan
seseorang
variabel pada lebih dari satu variabel penjelas, seperti pada hasil panen, curah
hujan, suhu,
sinar matahari, dan contoh pupuk, hal ini dikenal dengan analisis regresi
berganda. Lainnya
Kata dalam regresi dua variabel hanya ada satu variabel penjelas, sedangkan
secara multiple
regresi ada lebih dari satu variabel penjelas.
Istilah acak adalah sinonim untuk istilah stokastik. Seperti disebutkan sebelumnya,
acak atau
Variabel stokastik adalah variabel yang dapat mengambil serangkaian nilai, positif
atau negatif, dengan
probabilitas yang diberikan.9
Kecuali dinyatakan lain, huruf Y akan menunjukkan variabel dependen dan X
(X1, X2, ..., Xk) akan menunjukkan variabel penjelas, Xk menjadi kth explanatory
variabel. Subskrip i atau t akan menunjukkan nilai atau nilai pengamatan. Xki (atau
Xkt)
akan menunjukkan observasi ke-ih (atau tth) pada variabel Xk. N (atau T) akan
menunjukkan totalnya
jumlah pengamatan atau nilai dalam populasi, dan n (atau t) jumlah pengamatan
dalam sampel Sebagai soal konvensi, subskrip pengamatan saya akan digunakan
untuk
data cross-sectional (yaitu, data dikumpulkan pada satu titik waktu) dan subskrip t
akan menjadi
digunakan untuk data deret waktu (yaitu, data dikumpulkan selama periode waktu
tertentu). Sifat crosssectional
dan data deret waktu, serta topik penting dari sifat dan sumbernya
data untuk analisis empiris, dibahas pada bagian berikut.
Sumber dan Sumber Data untuk Analisis Ekonomi10
Keberhasilan analisis ekonometrik apapun pada akhirnya bergantung pada

ketersediaan
data yang sesuai Oleh karena itu penting bahwa kita meluangkan waktu untuk
membahas sifatnya,
sumber, dan keterbatasan data yang mungkin ditemui dalam analisis empiris.
Jenis Data
Tiga jenis data mungkin tersedia untuk analisis empiris: time series, cross-section,
dan
data gabungan, kombinasi dari deret waktu dan penampang).
Data Seri Waktu
Data yang ditunjukkan pada Tabel 1.1 dari Pendahuluan adalah contoh data deret
waktu. Sebuah waktu
seri adalah seperangkat pengamatan terhadap nilai yang dibutuhkan variabel

pada waktu yang berbeda. Data tersebut
dapat dikumpulkan pada interval waktu reguler, seperti harian (mis., harga saham,
cuaca
laporan), mingguan (mis. angka jumlah uang beredar), bulanan (mis., tingkat
pengangguran,
Indeks Harga Konsumen [CPI]), triwulanan (mis., PDB), setiap tahun (mis.,
Pemerintah
anggaran), setiap saat, setiap 5 tahun (mis., sensus manufaktur), atau
tidak lama lagi, yaitu setiap 10 tahun (mis., sensus penduduk). Beberapa waktu
adalah data
tersedia setiap triwulan maupun tahunan, seperti dalam kasus data PDB dan
konsumen
pengeluaran. Dengan munculnya komputer berkecepatan tinggi, data sekarang

dapat dikumpulkan melalui sebuah
Interval waktu yang sangat singkat, seperti data harga saham, yang bisa didapat
secara harfiah terus menerus (yang disebut real-time quote).
Meskipun data deret waktu digunakan dengan sangat dalam studi ekonometrik,
mereka menyajikan hal yang spesial
masalah bagi ekonometrik. Seperti yang akan kita tunjukkan di bab pada
ekonometri seri waktu
Kemudian, sebagian besar pekerjaan empiris berdasarkan data time series

mengasumsikan bahwa waktu yang mendasarinya
seri stasioner Meski terlalu dini untuk mengenalkan makna teknis yang tepat
stasioneritas pada saat ini, longgar berbicara, deret waktu adalah stasioner jika
mean dan
varians tidak berbeda secara sistematis dari waktu ke waktu. Untuk melihat apa
artinya ini, perhatikan Gambar 1.5,
yang menggambarkan perilaku pasokan uang M1 di Amerika Serikat mulai 1

Januari,
1959 sampai September 1999. (Data aktual diberikan dalam Latihan 1.4.) Seperti
yang dapat Anda lihat
Angka ini, jumlah uang beredar M1 menunjukkan tren kenaikan yang mantap dan
variabilitasnya
tahun, menunjukkan bahwa seri waktu M1 tidak stasioner.11 Kami akan

membahas topik ini
sepenuhnya di Bab 21.
Data cross-section adalah data pada satu atau lebih variabel yang dikumpulkan
pada titik waktu yang sama,
seperti sensus penduduk yang dilakukan oleh Biro Sensus setiap 10 tahun (yang
terbaru
berada di tahun 2000), survei pengeluaran konsumen yang dilakukan oleh

Universitas
dari Michigan, dan, tentu saja, jajak pendapat oleh Gallup dan sekian organisasi
lainnya.
Contoh konkret dari data cross-sectional diberikan pada Tabel 1.1. Tabel ini
memberikan data tentang
produksi telur dan harga telur untuk 50 negara bagian dalam serikat untuk tahun
1990 dan 1991. Untuk masing-masing
Sama seperti data deret waktu membuat masalah khusus mereka sendiri (karena
adanya stasioneritasnya
isu), data cross-sectional juga memiliki masalah tersendiri, khususnya masalah

heterogenitas.
Dari data yang diberikan pada Tabel 1.1 kita melihat bahwa kita memiliki beberapa
negara bagian yang menghasilkan besar
jumlah telur (mis., Pennsylvania) dan beberapa di antaranya menghasilkan sangat
sedikit (mis., Alaska). Kapan
Kami memasukkan unit heterogen semacam itu dalam analisis statistik, ukuran
atau besaran efeknya
diperhitungkan agar tidak mencampur apel dengan jeruk. Untuk melihat ini
dengan jelas, kita plot pada Gambar
1.6 data tentang telur yang diproduksi dan harganya di 50 negara bagian untuk
tahun 1990. Angka ini
menunjukkan seberapa tersebar luas pengamatan tersebut. Di Bab 11 kita akan

melihat bagaimana skalanya
Efek dapat menjadi faktor penting dalam menilai hubungan antar variabel
ekonomi.
Data kolam
Dalam gabungan, atau gabungan, data adalah elemen dari data time series dan
cross-section. Itu
Data pada Tabel 1.1 adalah contoh data gabungan. Untuk setiap tahun kita
memiliki 50 penampang melintang
pengamatan dan untuk setiap negara kita memiliki dua pengamatan deret waktu
mengenai harga dan keluaran
dari telur, total 100 pengamatan gabungan (atau gabungan). Demikian juga, data
yang diberikan di
Latihan 1.1 adalah kumpulan data dalam Indeks Harga Konsumen (IHK) untuk
masing-masing negara
untuk tahun 1980-2005 adalah data time series, sedangkan data CPI untuk ketujuh
negara tersebut
untuk satu tahun adalah data cross-sectional. Dalam kumpulan data, kita memiliki
182 observasi-
26 pengamatan tahunan untuk masing-masing dari tujuh negara.
Data Panel, Longitudinal, atau Micropanel
Ini adalah tipe khusus dari data gabungan dimana unit penampang melintang yang
sama (katakanlah, keluarga atau
sebuah perusahaan) disurvei dari waktu ke waktu. Misalnya, Departemen

Perdagangan A.S. melakukan
sensus perumahan pada interval periodik. Pada setiap survei berkala rumah
tangga yang sama
(atau orang yang tinggal di alamat yang sama) diwawancarai untuk mencari tahu
apakah sudah ada
perubahan kondisi perumahan dan keuangan rumah tangga tersebut sejak survei
terakhir. Oleh
mewawancarai rumah tangga yang sama secara berkala, data panel memberikan
informasi yang sangat berguna
tentang dinamika perilaku rumah tangga, seperti yang akan kita lihat di Bab 16
Sebagai contoh konkret, perhatikan data yang diberikan pada Tabel 1.2. Data pada
tabel awalnya
dikumpulkan oleh Y. Grunfeld, mengacu pada investasi riil, nilai sebenarnya dari
perusahaan, dan
persediaan modal sesungguhnya dari empat perusahaan A.S., yaitu General

Electric (GM), A.S. Steel
(AS), General Motors (GM), dan Westinghouse (BARAT), untuk periode 1935-
1954.12
Karena data untuk beberapa perusahaan dikumpulkan selama beberapa tahun, ini
adalah klasik
contoh data panel Dalam tabel ini, jumlah pengamatan untuk masing - masing
perusahaan adalah
sama, tapi ini tidak selalu terjadi. Jika semua perusahaan memiliki jumlah
observasi yang sama,
kita memiliki apa yang disebut panel seimbang. Jika jumlah pengamatan bukan
Sama untuk masing-masing perusahaan, itu disebut panel yang tidak seimbang. Di
Bab 16, Data Panel
Model Regresi, kami akan memeriksa data tersebut dan menunjukkan bagaimana
memperkirakan model seperti itu.
Tujuan Grunfeld dalam mengumpulkan data ini adalah untuk mengetahui

bagaimana investasi kotor riil (I)
tergantung pada nilai riil perusahaan (F) setahun sebelumnya dan persediaan
modal riil (C) setahun
sebelumnya. Karena perusahaan yang termasuk dalam sampel beroperasi di pasar

modal yang sama, oleh PT
Mengkaji mereka bersama, Grunfeld ingin tahu apakah mereka memiliki fungsi
investasi serupa.
Sumber Data13
Data yang digunakan dalam analisis empiris dapat dikumpulkan oleh agen
pemerintah (mis.,
Departemen Perdagangan), sebuah lembaga internasional (misalnya, Dana

Moneter Internasional)
[IMF] atau theWorld Bank), organisasi swasta (mis., Standard & Poor's
Corporation), atau
seorang individu. Secara harfiah, ada ribuan agen semacam itu yang
mengumpulkan data untuk satu tujuan
atau yang lainnya.
Internet
Internet telah benar-benar merevolusi pengumpulan data. Jika Anda hanya

"menjelajah internet" dengan a
kata kunci (misalnya, nilai tukar), Anda akan dibanjiri berbagai sumber data. Di
Lampiran E kami menyediakan beberapa situs web yang sering dikunjungi yang
menyediakan informasi ekonomi dan
data keuangan dari segala jenis. Sebagian besar data bisa diunduh tanpa biaya
banyak. Kamu boleh
ingin menandai berbagai situs web yang mungkin memberi Anda data ekonomi
yang berguna.
Data yang dikumpulkan oleh berbagai instansi mungkin eksperimental atau tidak
ada yang eksperimental.
Dalam data eksperimen, sering dikumpulkan dalam ilmu pengetahuan alam,

penyidik mungkin menginginkannya
mengumpulkan data sambil menahan faktor-faktor tertentu yang konstan untuk

menilai dampak beberapa orang
faktor pada fenomena tertentu. Misalnya, dalam menilai dampak obesitas

terhadap darah
Tekanan, peneliti ingin mengumpulkan data sambil terus makan,

merokok, dan kebiasaan minum masyarakat agar bisa meminimalisir pengaruh
tersebut
variabel pada tekanan darah
Dalam ilmu sosial, data yang umumnya ditemui tidak ada sama sekali
alam, yaitu tidak tunduk pada kontrol peneliti.14 Misalnya, data tentang GNP,
pengangguran, harga saham, dan lain-lain, tidak secara langsung berada di bawah
kendali penyidik. Seperti yang kita
Akan terlihat, kurangnya kontrol ini sering menimbulkan masalah khusus bagi
peneliti dalam menjepit
turunkan sebab atau sebab pasti yang mempengaruhi situasi tertentu. Misalnya,
apakah itu uangnya
penawaran yang menentukan PDB (nominal) atau sebaliknya?
Meskipun banyak data tersedia untuk penelitian ekonomi, kualitas data sering
dilakukan
tidak begitu bagus Ada beberapa alasan untuk itu.
1. Sebagaimana dicatat, sebagian besar data ilmu sosial tidak ada sifatnya. Oleh
karena itu, ada
kemungkinan kesalahan pengamatan, baik kelalaian atau komisi.
2. Bahkan dalam data eksperimen yang dikumpulkan, kesalahan pengukuran

timbul dari perkiraan
dan babak penyisihan
3. Dalam survei tipe kuesioner, masalah nonresponse bisa serius; seorang peneliti
beruntung mendapatkan tingkat respons 40 persen terhadap kuesioner. Analisis
berdasarkan hal tersebut
tingkat tanggapan parsial mungkin tidak benar-benar mencerminkan perilaku 60

persen yang tidak menanggapi,
sehingga mengarah pada apa yang dikenal sebagai (sampel) bias selektivitas. Lalu
ada
Masalah lebih lanjut bahwa mereka yang menanggapi kuesioner mungkin tidak
menjawab semua
pertanyaan, terutama pertanyaan tentang sifat finansial yang peka, sehingga

mengarah pada tambahan
bias selektifitas.
4. Metode pengambilan sampel yang digunakan untuk mendapatkan data

mungkin sangat bervariasi sehingga seringkali sulit
untuk membandingkan hasil yang diperoleh dari berbagai sampel.
5. Data ekonomi umumnya tersedia pada tingkat yang sangat agregat. Sebagai
contoh, sebagian besar
macrodata (mis., GNP, pekerjaan, inflasi, pengangguran) tersedia untuk

perekonomian
secara keseluruhan atau paling banyak untuk beberapa wilayah geografis yang
luas. Sangat agregat
data mungkin tidak banyak bercerita tentang individu atau microunit yang
mungkin
objek penelitian utama.
6. Karena kerahasiaan, data tertentu hanya bisa dipublikasikan dalam bentuk yang
sangat agregat.
IRS, misalnya, tidak diizinkan oleh undang-undang untuk mengungkapkan data
tentang pengembalian pajak individual;
itu hanya bisa merilis beberapa data ringkasan yang luas. Karena itu, jika
seseorang ingin mencari tahu caranya
Banyak individu dengan tingkat pendapatan tertentu yang dikeluarkan untuk

perawatan kesehatan, seseorang tidak dapat melakukannya
kecuali pada tingkat yang sangat agregat. Macanalisis semacam itu seringkali gagal
mengungkapkan dinamika
dari perilaku microunits. Demikian pula, Departemen Perdagangan,
yang melakukan sensus bisnis setiap 5 tahun, tidak diperkenankan untuk

mengungkapkan informasi
pada produksi, pekerjaan, konsumsi energi, penelitian dan pengembangan
pengeluaran, dll, pada firmlevel. Oleh karena itu sulit untuk mempelajari
interfirmdifferences
pada item ini
Rasio Skala
Untuk variabel X, mengambil dua nilai, X1 dan X2, rasio X1 X2 dan jarak (X2 - X1)
adalah jumlah yang berarti. Juga, ada pemesanan alami (naik atau turun) dari
nilai sepanjang skala Oleh karena itu, perbandingan seperti X2 ≤ X1 atau X2 ≥ X1

bermakna.
Sebagian besar variabel ekonomi termasuk dalam kategori ini. Jadi, sangat berarti
bertanya seberapa besar
PDB tahun ini dibandingkan dengan PDB tahun sebelumnya. Penghasilan pribadi,
diukur
dalam dolar, adalah variabel rasio; seseorang berpenghasilan $ 100.000 adalah
membuat dua kali lebih banyak dari yang lain
orang berpenghasilan $ 50.000 (sebelum pajak dinilai, tentu saja!).
Skala interval
Variabel skala interval memenuhi dua sifat terakhir dari variabel skala rasio namun
tidak
pertama. Dengan demikian, jarak antara dua periode waktu, katakanlah (2000-
1995) itu bermakna, tapi
bukan rasio dua periode waktu (2000/1995). Pukul 11:00 pukul PST tanggal 11
Agustus 2007,
Portland, Oregon, melaporkan suhu 60 derajat Fahrenheit sementara Tallahassee,
Florida, mencapai 90 derajat. Suhu tidak diukur pada skala rasio karena tidak
masuk akal untuk mengklaim bahwa Tallahassee adalah 50 persen lebih hangat
daripada Portland. Ini terutama
Karena fakta bahwa skala Fahrenheit tidak menggunakan 0 derajat sebagai dasar
alami.
Skala Ordinal
Variabel termasuk dalam kategori ini hanya jika memenuhi properti ketiga dari
skala rasio
(yaitu, pemesanan alami). Contohnya adalah sistem penilaian (nilai A, B, C) atau

kelas pendapatan
(atas, tengah, bawah). Untuk variabel ini, pemesanan ada tapi jarak antara
kategori tidak dapat dihitung. Siswa ekonomi akan mengingat kurva indiferennya
antara dua barang. Setiap kurva indiferen yang lebih tinggi menunjukkan tingkat
utilitas yang lebih tinggi, namun
Seseorang tidak dapat mengukur seberapa banyak satu kurva indiferen lebih tinggi
daripada yang lain.
Skala Nominal
Variabel dalam kategori ini tidak memiliki fitur variabel rasio. Variabel
seperti jenis kelamin (pria, wanita) dan status perkawinan (menikah, belum
menikah, bercerai, berpisah)
cukup tunjukkan kategori. Pertanyaan: Apa alasan mengapa variabel semacam itu
tidak mungkin?
diekspresikan pada skala rasio, interval, atau ordinal?
Seperti yang akan kita lihat, teknik ekonometri yang sesuai untuk variabel skala
rasio
mungkin tidak cocok untuk variabel skala nominal. Oleh karena itu, penting untuk
diingat
perbedaan antara keempat jenis skala pengukuran yang dibahas di atas.
Ringkasan dan
Kesimpulan
1. Gagasan utama di balik analisis regresi adalah ketergantungan statistik dari satu
variabel, yaitu
variabel dependen, pada satu atau lebih variabel lainnya, variabel penjelas.
2. Tujuan dari analisis tersebut adalah untuk memperkirakan dan / atau

memprediksi nilai rata-rata atau rata-rata dari
variabel dependen berdasarkan nilai variabel penjelas yang diketahui atau tetap.
3. Dalam prakteknya keberhasilan analisis regresi tergantung dari tersedianya yang

sesuai
data. Bab ini membahas sifat, sumber, dan keterbatasan data itu
umumnya tersedia untuk penelitian, terutama dalam ilmu sosial.
4. Dalam penelitian apapun, peneliti harus dengan jelas menyebutkan sumber

data yang digunakan dalam
analisis, definisi mereka, metode pengumpulan mereka, dan celah atau kelalaian
apapun
dalam data serta revisi apapun dalam data. Perlu diingat bahwa makroekonomi
data yang diterbitkan oleh pemerintah sering direvisi.
5. Karena pembaca mungkin tidak punya waktu, tenaga, atau sumber daya untuk
melacak data, maka
pembaca berhak menganggap bahwa data yang digunakan oleh peneliti telah
benar
dikumpulkan dan bahwa perhitungan dan analisisnya benar.
1.1. Tabel 1.3 memberikan data Indeks Harga Konsumen (IHK) untuk tujuh industri
negara dengan 1982-1984 = 100 sebagai basis indeks.
Sebuah. Dari data yang diberikan, hitung tingkat inflasi masing-masing negara.17
b. Plot tingkat inflasi untuk masing-masing negara terhadap waktu (yaitu, gunakan
sumbu horizontal untuk
waktu dan sumbu vertikal untuk tingkat inflasi).

c. Kesimpulan umum apa yang bisa Anda tarik tentang pengalaman inflasi di tujuh
negara
negara?
d. Tingkat inflasi negara manakah yang paling bervariasi? Dapatkah Anda

menawarkan apapun?
penjelasan?
1.2. Sebuah. Dengan menggunakan Tabel 1.3, plot tingkat inflasi Kanada, Prancis,
Jerman, Italia, Jepang,
dan Inggris terhadap tingkat inflasi Amerika Serikat.
b. Komentar umumnya tentang perilaku tingkat inflasi di enam negara
vis-à-vis tingkat inflasi A.S.
c. Jika Anda menemukan bahwa tingkat inflasi enam negara tersebut bergerak ke
arah yang sama dengan
Tingkat inflasi A.S., apakah itu berarti bahwa inflasi A.S. "menyebabkan" inflasi di
negara-negara lain? Mengapa atau mengapa tidak?
1.3. Tabel 1.4 memberikan nilai tukar mata uang asing untuk sembilan negara
industri untuk
tahun 1985-2006. Kecuali untuk Inggris, nilai tukar didefinisikan sebagai
satuan mata uang asing untuk satu dolar A.S.; untuk Inggris, itu didefinisikan
sebagai jumlah dolar A.S. untuk satu pound Inggris.
Sebuah. Plot nilai tukar ini terhadap waktu dan komentari perilaku umum
nilai tukar selama periode waktu yang ditentukan.

b. Dolar dikatakan menghargai jika bisa membeli lebih banyak unit mata uang
asing.
Sebaliknya, dikatakan terdepresiasi jika membeli lebih sedikit unit mata uang
asing. Lebih
periode 1985-2006, apa yang menjadi perilaku umum dolar A.S.?
Kebetulan, cari buku teks tentang makroekonomi atau ekonomi internasional
untuk mengetahui faktor apa yang menentukan apresiasi atau depresiasi suatu
mata uang.
1.4. Data di balik jumlah uang M1 pada Gambar 1.5 diberikan pada Tabel 1.5.
Bisakah kamu
memberikan alasan mengapa jumlah uang beredar meningkat selama periode

waktu yang ditunjukkan pada
meja?
1.5. Misalkan Anda mengembangkan model ekonomi dari kegiatan kriminal,

katakanlah, waktunya
dihabiskan dalam kegiatan kriminal (mis., menjual obat-obatan terlarang). Variabel

apa yang akan Anda pertimbangkan
dalam mengembangkan model seperti itu? Lihat apakah model Anda sesuai
dengan yang dikembangkan oleh
Ekonom pemenang Nobel Gary Becker.18

Bab 1

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab 1

Diunggah oleh

Hak Cipta:

Format Tersedia

Bab 1

1. Pertimbangkan kembali hukum regresi universal Galton. Galton tertarik untuk

Anak laki-laki umumnya meningkat saat tinggi ayahnya meningkat. Untuk

Anak laki-laki meningkat dengan tinggi ayahnya

2. Pertimbangkan scattergram pada Gambar 1.2, yang memberikan distribusi

memiliki ketinggian yang sama. Tapi tinggi rata-rata meningkat seiring

Hubungan Statistik versus Deterministik

ketergantungan antar variabel, seperti fisika klasik. Dalam hubungan statistik

Di antara variabel dasarnya kita berhadapan dengan variabel acak atau

variabel yang memiliki distribusi probabilitas. Dalam ketergantungan fungsional

Contohnya, bersifat statistik dalam arti bahwa variabel penjelasnya, walaupun

kesalahan yang terlibat dalam mengukur variabel-variabel ini serta sejumlah

k adalah konstanta proporsionalitas. Contoh lainnya

Dari hubungan deterministik tersebut adalah hukum gas Boyle, undang-undang

Hukum gerak Newton.

Ada kesalahan pengukuran, misalnya, dalam teori hukum gravitasi Newton,

Hubungan deterministik menjadi hubungan statistik. Dalam situasi ini, kekuatan

Dengan sendirinya tidak bisa secara logis menyiratkan sebab-akibat. Untuk

Teori mengatakan bahwa pengeluaran konsumsi bergantung pada pendapatan riil.

Regresi versus Korelasi

mungkin tertarik untuk menemukan korelasi (koefisien) antara merokok dan

skor pada ujian matematika

variabel diperlakukan. Variabel dependen diasumsikan bersifat statistik, acak, atau

yaitu, untuk memiliki distribusi probabilitas. Variabel penjelas, di sisi lain

asumsi keacakan variabel, sedangkan sebagian besar teori regresi

stochastic namun variabel penjelasnya adalah fixed atau nonstochastic.8

Terminologi dan Notasi

Variabel penjelas dijelaskan dengan berbagai cara. Daftar perwakilan adalah:

Variabel dependen Variabel penjelasan

Dijelaskan variabel Variabel Independen

Prediktor dan Prediktor

Regress dan Regressor

Variabel kontrol variabel terkontrol

regresi ada lebih dari satu variabel penjelas.

probabilitas yang diberikan.9

Kecuali dinyatakan lain, huruf Y akan menunjukkan variabel dependen dan X

data untuk analisis empiris, dibahas pada bagian berikut.

Sumber dan Sumber Data untuk Analisis Ekonomi10

Keberhasilan analisis ekonometrik apapun pada akhirnya bergantung pada

data gabungan, kombinasi dari deret waktu dan penampang).

Data Seri Waktu

seri adalah seperangkat pengamatan terhadap nilai yang dibutuhkan variabel

anggaran), setiap saat, setiap 5 tahun (mis., sensus manufaktur), atau

pengeluaran. Dengan munculnya komputer berkecepatan tinggi, data sekarang

secara harfiah terus menerus (yang disebut real-time quote).

Kemudian, sebagian besar pekerjaan empiris berdasarkan data time series

yang menggambarkan perilaku pasokan uang M1 di Amerika Serikat mulai 1

tahun, menunjukkan bahwa seri waktu M1 tidak stasioner.11 Kami akan

sepenuhnya di Bab 21.

berada di tahun 2000), survei pengeluaran konsumen yang dilakukan oleh

isu), data cross-sectional juga memiliki masalah tersendiri, khususnya masalah

menunjukkan seberapa tersebar luas pengamatan tersebut. Di Bab 11 kita akan

26 pengamatan tahunan untuk masing-masing dari tujuh negara.

Data Panel, Longitudinal, atau Micropanel

sebuah perusahaan) disurvei dari waktu ke waktu. Misalnya, Departemen

persediaan modal sesungguhnya dari empat perusahaan A.S., yaitu General

Tujuan Grunfeld dalam mengumpulkan data ini adalah untuk mengetahui

sebelumnya. Karena perusahaan yang termasuk dalam sampel beroperasi di pasar

Departemen Perdagangan), sebuah lembaga internasional (misalnya, Dana

atau yang lainnya.

Internet telah benar-benar merevolusi pengumpulan data. Jika Anda hanya

Dalam data eksperimen, sering dikumpulkan dalam ilmu pengetahuan alam,

mengumpulkan data sambil menahan faktor-faktor tertentu yang konstan untuk