Bab 1
Bab 1
1,2
Namun, interpretasi modern tentang regresi sangat
berbeda. Secara umum, kita
boleh bilang
Analisis regresi berkaitan dengan studi ketergantungan
satu variabel, yaitu
variabel dependen, pada satu atau lebih variabel
lainnya, variabel penjelas, dengan tujuan untuk
memperkirakan dan / atau memprediksi mean (populasi)
atau nilai rata-rata dari yang sebelumnya
nilai yang diketahui atau tetap (dalam sampel berulang)
dari yang terakhir.
Contoh
mengapa ada stabilitas dalam distribusi ketinggian dalam suatu populasi. Tapi di
modern
Perhatian kita bukan dengan penjelasan ini melainkan dengan mencari tahu
bagaimana rata-rata
Tinggi perubahan anak laki-laki, mengingat tinggi ayah. Dengan kata lain,
perhatian kita adalah dengan memprediksi
Tinggi rata-rata anak laki-laki mengetahui ketinggian ayah mereka. Untuk melihat
bagaimana ini bisa
Bisa dilakukan, perhatikan Gambar 1.1, yaitu scatter diagram, atau scattergram.
Angka ini
menunjukkan distribusi ketinggian anak laki - laki dalam populasi hipotetis yang
sesuai dengan
diberikan atau nilai tetap tinggi ayah. Perhatikan bahwa sesuai dengan ketinggian
tertentu
Seorang ayah adalah rentang atau distribusi ketinggian anak laki-laki. Namun,
perhatikan bahwa meskipun
variabilitas tinggi anak laki-laki untuk nilai tertentu tinggi ayah, tinggi rata-rata
Salib pada gambar menunjukkan tinggi rata-rata anak yang sesuai dengan yang
diberikan
tinggi sang ayah Menghubungkan rata-rata ini, kita mendapatkan garis yang
ditunjukkan pada gambar. Ini
Garis, seperti yang akan kita lihat, dikenal sebagai garis regresi. Ini menunjukkan
bagaimana tinggi rata-rata
populasi ketinggian anak laki-laki diukur pada usia tetap. Sesuai dengan usia
tertentu, kita
memiliki jangkauan, atau distribusi, ketinggian. Jelas, tidak semua anak laki-laki
dari usia tertentu cenderung melakukannya
Dari contoh yang dikutip di Bagian 1.2, pembaca akan memperhatikan bahwa
dalam analisis regresi
kita prihatin dengan apa yang dikenal sebagai statistik, tidak fungsional atau
deterministik,
Di sisi lain, kita juga berurusan dengan variabel, tapi variabel ini tidak acak atau
stochastic.
Ketergantungan hasil panen pada suhu, curah hujan, sinar matahari, dan pupuk,
untuk
Yang pasti penting, tidak akan memungkinkan ahli agronomi memprediksi hasil
panen dengan tepat karena
yang secara kolektif mempengaruhi hasil tetapi mungkin sulit untuk diidentifikasi
secara individual. Jadi, ada
terikat untuk menjadi beberapa variabilitas "intrinsik" atau acak dalam variabel
tergantung hasil panen itu
tidak bisa sepenuhnya dijelaskan tidak peduli berapa banyak variabel penjelas
yang kita anggap.
Dalam fenomena deterministik, di sisi lain, kita berurusan dengan hubungan tipe,
katakanlah, dipamerkan oleh hukum gravitasi Newton, yang menyatakan: Setiap
partikel di alam semesta
Menarik setiap partikel lain dengan kekuatan yang berbanding lurus dengan
produk massa mereka
dan berbanding terbalik dengan kuadrat jarak di antara keduanya. Secara simbolis,
F = k (m1m2 / r 2), di mana F = force, m1 dan m2 adalah massa dari dua partikel, r
=
jarak, dan k = konstanta proporsionalitas. Contoh lain adalah hukum Ohm, yang
menyatakan:
Untuk konduktor logam pada kisaran suhu yang terbatas, C saat ini sebanding
dengan
tegangan V; yaitu, C = (1
k) V dimana 1
Dalam teks ini kita tidak peduli dengan hubungan deterministik semacam itu.
Tentu saja jika
diprediksi hanya kira-kira dari nilai k (dan m1, m2, dan r) yang ada
kesalahan Variabel F dalam hal ini menjadi variabel acak.
Regresi versus Penyebab
Meskipun analisis regresi berhubungan dengan
ketergantungan satu variabel pada variabel lain,
Itu tidak selalu berarti sebab-akibat. Dalam kata-kata
Kendall dan Stuart, "statistik
hubungan, betapapun kuatnya dan betapapun sugestifnya,
tidak dapat membangun hubungan kausal:
Ide penyebab kita harus berasal dari statistik luar,
akhirnya dari beberapa teori
atau yang lain."
Dalam contoh hasil panen yang dikutip sebelumnya, tidak ada alasan statistik
untuk mengasumsikannya
curah hujan tidak tergantung pada hasil panen. Fakta bahwa kita memperlakukan
hasil panen sebagai tergantung pada
curah hujan (antara lain) adalah karena pertimbangan nonstatistik: akal sehat
menunjukkan bahwa hubungan tersebut tidak dapat dibalik, karena kita tidak
dapat mengendalikan curah hujan dengan cara yang bervariasi
hasil panen
Dalam semua contoh yang dikutip di Bagian 1.2, yang perlu diperhatikan adalah
hubungan statistik
atau pertimbangan teoretis. Jadi, dalam contoh ketiga dikutip, seseorang dapat
meminta ekonomi
Analisis korelasi, dimana tujuan utamanya adalah untuk mengukur kekuatan atau
derajat
hubungan linier antara dua variabel. Koefisien korelasi, yang akan kita dapatkan
belajar secara rinci di Bab 3, mengukur kekuatan asosiasi (linier) ini. Misalnya, kita
antara skor statistik dan ujian matematika, antara nilai sekolah menengah
dan nilai kuliah, dan sebagainya. Dalam analisis regresi, seperti yang telah dicatat,
kita tidak terutama
tertarik pada ukuran seperti itu. Sebagai gantinya, kami mencoba memperkirakan
atau memprediksi nilai rata-rata
satu variabel berdasarkan nilai tetap variabel lainnya. Jadi, kita mungkin ingin tahu
apakah kita bisa memprediksi skor rata-rata pada pemeriksaan statistik dengan
mengetahui siswa
Regresi dan korelasi memiliki beberapa perbedaan mendasar yang patut disebut.
Dalam analisis regresi ada suatu asimetri dengan cara yang dependen dan jelas
tangan, diasumsikan memiliki nilai tetap (dalam sampling berulang), 7 yang dibuat
eksplisit di
definisi regresi yang diberikan pada Bagian 1.2. Jadi, pada Gambar 1.2 kita
mengasumsikan bahwa
Usia variabel ditetapkan pada tingkat yang ditentukan dan pengukuran tinggi
diperoleh pada saat ini
tingkat. Dalam analisis korelasi, di sisi lain, kita memperlakukan setiap (dua)
variabel secara simetris;
tidak ada perbedaan antara variabel dependen dan explanatory. Setelah semua,
korelasi antara skor pada matematika dan ujian statistik sama dengan itu
antara skor pada statistik dan ujian matematika. Apalagi kedua variabel tersebut
diasumsikan acak. Seperti yang akan kita lihat, sebagian besar teori korelasi
didasarkan pada
diuraikan dalam buku ini tergantung pada asumsi bahwa variabel dependennya
adalah
Sebelum kita melanjutkan ke analisis formal teori regresi, mari kita tinggal
sebentar di
masalah terminologi dan notasi. Dalam literatur istilah dependen variabel dan
Apakah ini?
Apakah ini?
Apakah ini?
Respon Stimulus
Apakah ini?
Endogenous Exogenous
Apakah ini?
Hasil Kovariat
Apakah ini?
Meski soal selera dan tradisi pribadi, dalam teks ini kita akan menggunakan
ketergantungan
variabel / variabel jelas atau terminologi regressand dan regressor yang lebih
netral.
Jika kita mempelajari ketergantungan variabel hanya pada satu variabel penjelas
tunggal,
seperti pengeluaran konsumsi untuk pendapatan riil, studi semacam itu dikenal
sederhana,
atau dua variabel, analisis regresi. Namun, jika kita mempelajari ketergantungan
seseorang
variabel pada lebih dari satu variabel penjelas, seperti pada hasil panen, curah
hujan, suhu,
sinar matahari, dan contoh pupuk, hal ini dikenal dengan analisis regresi
berganda. Lainnya
Kata dalam regresi dua variabel hanya ada satu variabel penjelas, sedangkan
secara multiple
Istilah acak adalah sinonim untuk istilah stokastik. Seperti disebutkan sebelumnya,
acak atau
Variabel stokastik adalah variabel yang dapat mengambil serangkaian nilai, positif
atau negatif, dengan
(X1, X2, ..., Xk) akan menunjukkan variabel penjelas, Xk menjadi kth explanatory
variabel. Subskrip i atau t akan menunjukkan nilai atau nilai pengamatan. Xki (atau
Xkt)
akan menunjukkan observasi ke-ih (atau tth) pada variabel Xk. N (atau T) akan
menunjukkan totalnya
jumlah pengamatan atau nilai dalam populasi, dan n (atau t) jumlah pengamatan
dalam sampel Sebagai soal konvensi, subskrip pengamatan saya akan digunakan
untuk
data cross-sectional (yaitu, data dikumpulkan pada satu titik waktu) dan subskrip t
akan menjadi
digunakan untuk data deret waktu (yaitu, data dikumpulkan selama periode waktu
tertentu). Sifat crosssectional
dan data deret waktu, serta topik penting dari sifat dan sumbernya
data yang sesuai Oleh karena itu penting bahwa kita meluangkan waktu untuk
membahas sifatnya,
sumber, dan keterbatasan data yang mungkin ditemui dalam analisis empiris.
Jenis Data
Tiga jenis data mungkin tersedia untuk analisis empiris: time series, cross-section,
dan
Data yang ditunjukkan pada Tabel 1.1 dari Pendahuluan adalah contoh data deret
waktu. Sebuah waktu
dapat dikumpulkan pada interval waktu reguler, seperti harian (mis., harga saham,
cuaca
laporan), mingguan (mis. angka jumlah uang beredar), bulanan (mis., tingkat
pengangguran,
Indeks Harga Konsumen [CPI]), triwulanan (mis., PDB), setiap tahun (mis.,
Pemerintah
tidak lama lagi, yaitu setiap 10 tahun (mis., sensus penduduk). Beberapa waktu
adalah data
tersedia setiap triwulan maupun tahunan, seperti dalam kasus data PDB dan
konsumen
Interval waktu yang sangat singkat, seperti data harga saham, yang bisa didapat
Meskipun data deret waktu digunakan dengan sangat dalam studi ekonometrik,
mereka menyajikan hal yang spesial
masalah bagi ekonometrik. Seperti yang akan kita tunjukkan di bab pada
ekonometri seri waktu
seri stasioner Meski terlalu dini untuk mengenalkan makna teknis yang tepat
stasioneritas pada saat ini, longgar berbicara, deret waktu adalah stasioner jika
mean dan
varians tidak berbeda secara sistematis dari waktu ke waktu. Untuk melihat apa
artinya ini, perhatikan Gambar 1.5,
Angka ini, jumlah uang beredar M1 menunjukkan tren kenaikan yang mantap dan
variabilitasnya
Data cross-section adalah data pada satu atau lebih variabel yang dikumpulkan
pada titik waktu yang sama,
seperti sensus penduduk yang dilakukan oleh Biro Sensus setiap 10 tahun (yang
terbaru
dari Michigan, dan, tentu saja, jajak pendapat oleh Gallup dan sekian organisasi
lainnya.
Contoh konkret dari data cross-sectional diberikan pada Tabel 1.1. Tabel ini
memberikan data tentang
produksi telur dan harga telur untuk 50 negara bagian dalam serikat untuk tahun
1990 dan 1991. Untuk masing-masing
Sama seperti data deret waktu membuat masalah khusus mereka sendiri (karena
adanya stasioneritasnya
Dari data yang diberikan pada Tabel 1.1 kita melihat bahwa kita memiliki beberapa
negara bagian yang menghasilkan besar
jumlah telur (mis., Pennsylvania) dan beberapa di antaranya menghasilkan sangat
sedikit (mis., Alaska). Kapan
Kami memasukkan unit heterogen semacam itu dalam analisis statistik, ukuran
atau besaran efeknya
diperhitungkan agar tidak mencampur apel dengan jeruk. Untuk melihat ini
dengan jelas, kita plot pada Gambar
1.6 data tentang telur yang diproduksi dan harganya di 50 negara bagian untuk
tahun 1990. Angka ini
Efek dapat menjadi faktor penting dalam menilai hubungan antar variabel
ekonomi.
Data kolam
Dalam gabungan, atau gabungan, data adalah elemen dari data time series dan
cross-section. Itu
Data pada Tabel 1.1 adalah contoh data gabungan. Untuk setiap tahun kita
memiliki 50 penampang melintang
pengamatan dan untuk setiap negara kita memiliki dua pengamatan deret waktu
mengenai harga dan keluaran
dari telur, total 100 pengamatan gabungan (atau gabungan). Demikian juga, data
yang diberikan di
Latihan 1.1 adalah kumpulan data dalam Indeks Harga Konsumen (IHK) untuk
masing-masing negara
untuk tahun 1980-2005 adalah data time series, sedangkan data CPI untuk ketujuh
negara tersebut
untuk satu tahun adalah data cross-sectional. Dalam kumpulan data, kita memiliki
182 observasi-
Ini adalah tipe khusus dari data gabungan dimana unit penampang melintang yang
sama (katakanlah, keluarga atau
sensus perumahan pada interval periodik. Pada setiap survei berkala rumah
tangga yang sama
(atau orang yang tinggal di alamat yang sama) diwawancarai untuk mencari tahu
apakah sudah ada
perubahan kondisi perumahan dan keuangan rumah tangga tersebut sejak survei
terakhir. Oleh
mewawancarai rumah tangga yang sama secara berkala, data panel memberikan
informasi yang sangat berguna
tentang dinamika perilaku rumah tangga, seperti yang akan kita lihat di Bab 16
Sebagai contoh konkret, perhatikan data yang diberikan pada Tabel 1.2. Data pada
tabel awalnya
dikumpulkan oleh Y. Grunfeld, mengacu pada investasi riil, nilai sebenarnya dari
perusahaan, dan
(AS), General Motors (GM), dan Westinghouse (BARAT), untuk periode 1935-
1954.12
Karena data untuk beberapa perusahaan dikumpulkan selama beberapa tahun, ini
adalah klasik
contoh data panel Dalam tabel ini, jumlah pengamatan untuk masing - masing
perusahaan adalah
sama, tapi ini tidak selalu terjadi. Jika semua perusahaan memiliki jumlah
observasi yang sama,
kita memiliki apa yang disebut panel seimbang. Jika jumlah pengamatan bukan
Sama untuk masing-masing perusahaan, itu disebut panel yang tidak seimbang. Di
Bab 16, Data Panel
Model Regresi, kami akan memeriksa data tersebut dan menunjukkan bagaimana
memperkirakan model seperti itu.
tergantung pada nilai riil perusahaan (F) setahun sebelumnya dan persediaan
modal riil (C) setahun
Mengkaji mereka bersama, Grunfeld ingin tahu apakah mereka memiliki fungsi
investasi serupa.
Sumber Data13
Data yang digunakan dalam analisis empiris dapat dikumpulkan oleh agen
pemerintah (mis.,
seorang individu. Secara harfiah, ada ribuan agen semacam itu yang
mengumpulkan data untuk satu tujuan
Internet
kata kunci (misalnya, nilai tukar), Anda akan dibanjiri berbagai sumber data. Di
Lampiran E kami menyediakan beberapa situs web yang sering dikunjungi yang
menyediakan informasi ekonomi dan
data keuangan dari segala jenis. Sebagian besar data bisa diunduh tanpa biaya
banyak. Kamu boleh
ingin menandai berbagai situs web yang mungkin memberi Anda data ekonomi
yang berguna.
Data yang dikumpulkan oleh berbagai instansi mungkin eksperimental atau tidak
ada yang eksperimental.
Dalam ilmu sosial, data yang umumnya ditemui tidak ada sama sekali
alam, yaitu tidak tunduk pada kontrol peneliti.14 Misalnya, data tentang GNP,
pengangguran, harga saham, dan lain-lain, tidak secara langsung berada di bawah
kendali penyidik. Seperti yang kita
Akan terlihat, kurangnya kontrol ini sering menimbulkan masalah khusus bagi
peneliti dalam menjepit
turunkan sebab atau sebab pasti yang mempengaruhi situasi tertentu. Misalnya,
apakah itu uangnya
Meskipun banyak data tersedia untuk penelitian ekonomi, kualitas data sering
dilakukan
1. Sebagaimana dicatat, sebagian besar data ilmu sosial tidak ada sifatnya. Oleh
karena itu, ada
3. Dalam survei tipe kuesioner, masalah nonresponse bisa serius; seorang peneliti
beruntung mendapatkan tingkat respons 40 persen terhadap kuesioner. Analisis
berdasarkan hal tersebut
sehingga mengarah pada apa yang dikenal sebagai (sampel) bias selektivitas. Lalu
ada
Masalah lebih lanjut bahwa mereka yang menanggapi kuesioner mungkin tidak
menjawab semua
bias selektifitas.
5. Data ekonomi umumnya tersedia pada tingkat yang sangat agregat. Sebagai
contoh, sebagian besar
secara keseluruhan atau paling banyak untuk beberapa wilayah geografis yang
luas. Sangat agregat
data mungkin tidak banyak bercerita tentang individu atau microunit yang
mungkin
6. Karena kerahasiaan, data tertentu hanya bisa dipublikasikan dalam bentuk yang
sangat agregat.
IRS, misalnya, tidak diizinkan oleh undang-undang untuk mengungkapkan data
tentang pengembalian pajak individual;
itu hanya bisa merilis beberapa data ringkasan yang luas. Karena itu, jika
seseorang ingin mencari tahu caranya
kecuali pada tingkat yang sangat agregat. Macanalisis semacam itu seringkali gagal
mengungkapkan dinamika
pengeluaran, dll, pada firmlevel. Oleh karena itu sulit untuk mempelajari
interfirmdifferences
Rasio Skala
Untuk variabel X, mengambil dua nilai, X1 dan X2, rasio X1 X2 dan jarak (X2 - X1)
adalah jumlah yang berarti. Juga, ada pemesanan alami (naik atau turun) dari
Sebagian besar variabel ekonomi termasuk dalam kategori ini. Jadi, sangat berarti
bertanya seberapa besar
PDB tahun ini dibandingkan dengan PDB tahun sebelumnya. Penghasilan pribadi,
diukur
dalam dolar, adalah variabel rasio; seseorang berpenghasilan $ 100.000 adalah
membuat dua kali lebih banyak dari yang lain
Skala interval
Variabel skala interval memenuhi dua sifat terakhir dari variabel skala rasio namun
tidak
pertama. Dengan demikian, jarak antara dua periode waktu, katakanlah (2000-
1995) itu bermakna, tapi
bukan rasio dua periode waktu (2000/1995). Pukul 11:00 pukul PST tanggal 11
Agustus 2007,
Florida, mencapai 90 derajat. Suhu tidak diukur pada skala rasio karena tidak
masuk akal untuk mengklaim bahwa Tallahassee adalah 50 persen lebih hangat
daripada Portland. Ini terutama
Karena fakta bahwa skala Fahrenheit tidak menggunakan 0 derajat sebagai dasar
alami.
Skala Ordinal
Variabel termasuk dalam kategori ini hanya jika memenuhi properti ketiga dari
skala rasio
(atas, tengah, bawah). Untuk variabel ini, pemesanan ada tapi jarak antara
kategori tidak dapat dihitung. Siswa ekonomi akan mengingat kurva indiferennya
antara dua barang. Setiap kurva indiferen yang lebih tinggi menunjukkan tingkat
utilitas yang lebih tinggi, namun
Seseorang tidak dapat mengukur seberapa banyak satu kurva indiferen lebih tinggi
daripada yang lain.
Skala Nominal
Variabel dalam kategori ini tidak memiliki fitur variabel rasio. Variabel
seperti jenis kelamin (pria, wanita) dan status perkawinan (menikah, belum
menikah, bercerai, berpisah)
cukup tunjukkan kategori. Pertanyaan: Apa alasan mengapa variabel semacam itu
tidak mungkin?
Seperti yang akan kita lihat, teknik ekonometri yang sesuai untuk variabel skala
rasio
mungkin tidak cocok untuk variabel skala nominal. Oleh karena itu, penting untuk
diingat
Ringkasan dan
Kesimpulan
1. Gagasan utama di balik analisis regresi adalah ketergantungan statistik dari satu
variabel, yaitu
variabel dependen, pada satu atau lebih variabel lainnya, variabel penjelas.
data. Bab ini membahas sifat, sumber, dan keterbatasan data itu
analisis, definisi mereka, metode pengumpulan mereka, dan celah atau kelalaian
apapun
dalam data serta revisi apapun dalam data. Perlu diingat bahwa makroekonomi
5. Karena pembaca mungkin tidak punya waktu, tenaga, atau sumber daya untuk
melacak data, maka
pembaca berhak menganggap bahwa data yang digunakan oleh peneliti telah
benar
1.1. Tabel 1.3 memberikan data Indeks Harga Konsumen (IHK) untuk tujuh industri
Sebuah. Dari data yang diberikan, hitung tingkat inflasi masing-masing negara.17
b. Plot tingkat inflasi untuk masing-masing negara terhadap waktu (yaitu, gunakan
sumbu horizontal untuk
negara?
penjelasan?
1.2. Sebuah. Dengan menggunakan Tabel 1.3, plot tingkat inflasi Kanada, Prancis,
Jerman, Italia, Jepang,
c. Jika Anda menemukan bahwa tingkat inflasi enam negara tersebut bergerak ke
arah yang sama dengan
Tingkat inflasi A.S., apakah itu berarti bahwa inflasi A.S. "menyebabkan" inflasi di
1.3. Tabel 1.4 memberikan nilai tukar mata uang asing untuk sembilan negara
industri untuk
satuan mata uang asing untuk satu dolar A.S.; untuk Inggris, itu didefinisikan
Sebuah. Plot nilai tukar ini terhadap waktu dan komentari perilaku umum
Sebaliknya, dikatakan terdepresiasi jika membeli lebih sedikit unit mata uang
asing. Lebih
untuk mengetahui faktor apa yang menentukan apresiasi atau depresiasi suatu
mata uang.
1.4. Data di balik jumlah uang M1 pada Gambar 1.5 diberikan pada Tabel 1.5.
Bisakah kamu
meja?
dalam mengembangkan model seperti itu? Lihat apakah model Anda sesuai
dengan yang dikembangkan oleh