Anda di halaman 1dari 149

Machine Translated by Google

Birkbeck
Departemen Ekonomi,
Matematika dan Statistik

Sertifikat Pascasarjana dan Diploma


Ekonomi, Keuangan, Teknik Keuangan;
BSc FE, ESP.
2009-2010

Statistik Terapan dan Ekonometrika


Catatan dan Latihan

Ron Smith
Email R.Smith@bbk.ac.uk
Machine Translated by Google

ISI
BAGIAN I: INFORMASI KURSUS 1. Tujuan,
bacaan, dan pendekatan 2 Latihan Kelas 3.
Penilaian 4. Bagaimana mengerjakan proyek
Anda BAGIAN II: CATATAN 5. Pendahuluan 6.
Statistik Deskriptif 7. Data Ekonomi dan Keuangan
I: Angka 8. Latihan Terapan I : Rasio dan statistik
deskriptif 9. Angka Indeks 10. Probabilitas 11.
Variabel Acak Diskrit 12. Variabel Acak Kontinu
13. Data Ekonomi dan Keuangan II: Bunga dan Suku Bunga
14. Latihan Terapan II: Distribusi Sampling 15. Estimasi 16. Interval
Keyakinan dan Uji Hipotesis untuk mean 17. Regresi Kuadrat Terkecil
Bivariat 18. Aljabar Matriks & Regresi Berganda 19. Sifat-sifat Estimasi
Kuadrat Terkecil 20. Interval dan Uji Keyakinan Regresi 21. Data Ekonomi
dan Keuangan III: Hubungan 22. Latihan Terapan III: Menjalankan regresi
23 Dinamika 24. Hasil matriks tambahan 25. Indeks

2
Machine Translated by Google

1. BAGIAN I: Informasi Kursus


1.1. Tujuan

Ekonom telah digambarkan sebagai orang yang pandai dengan angka tetapi tidak cukup kreatif untuk menjadi
akuntan. Kursus ini dirancang untuk memastikan bahwa Anda mahir dengan angka; bahwa Anda dapat
menafsirkan dan menganalisis data ekonomi dan keuangan dan mengembangkan kesadaran kritis dari beberapa
perangkap dalam mengumpulkan, menyajikan dan menggunakan data. Melakukan pekerjaan terapan melibatkan
sintesis berbagai elemen. Anda harus jelas tentang mengapa Anda melakukannya: apa tujuan dari latihan
tersebut (misalnya peramalan, pembuatan kebijakan, memilih portofolio saham, menjawab pertanyaan tertentu
atau menguji hipotesis). Anda harus memahami karakteristik data yang Anda gunakan dan menghargai
kelemahannya. Anda harus menggunakan teori untuk menyediakan model proses yang mungkin menghasilkan
data. Anda harus mengetahui metode statistik, yang mengandalkan teori probabilitas, untuk meringkas data,
misalnya dalam perkiraan. Anda harus dapat menggunakan perangkat lunak, misalnya spreadsheet, yang akan
menghasilkan perkiraan. Anda harus dapat menginterpretasikan statistik atau perkiraan sesuai dengan tujuan
awal dan teori Anda. Jadi selama kursus ini kita akan bergerak maju mundur di antara elemen-elemen ini: tujuan,
data, teori, dan metode statistik. Tampaknya kita melompat-lompat, tetapi Anda harus belajar melakukan semua
hal yang berbeda ini bersama-sama.

Bagian I dari buklet ini memberikan informasi latar belakang: daftar bacaan; rincian penilaian (70% ujian,
30% proyek) dan instruksi tentang cara mengerjakan proyek Anda.
Bagian II menyediakan satu set catatan. Ini termasuk catatan tentang kuliah, catatan tentang data ekonomi dan
keuangan, dan latihan terapan.
Tidak semua materi dalam buklet ini akan dibahas secara eksplisit dalam perkuliahan, khususnya pada
bagian data ekonomi dan keuangan. Tetapi Anda harus terbiasa dengan materi itu. Banyak contoh yang berhasil
didasarkan pada pertanyaan ujian lama.
Bagian berlabel background berisi materi yang tidak akan di ujiankan. Jika Anda memiliki pertanyaan tentang
bagian ini, ajukan dalam kuliah atau kelas. Jika Anda menemukan kesalahan dalam buklet ini, tolong beritahu
saya. Kelompok siswa masa depan akan berterima kasih.

1.2. Garis Besar Kuliah Kasar

Topik-topik ini kira-kira sesuai dengan kuliah masing-masing, meskipun dalam praktiknya mungkin berjalan
sedikit lebih cepat atau lebih lambat.
MUSIM GUGUR

3
Machine Translated by Google

1. Pendahuluan 2.
Statistik Deskriptif 3. Bilangan
Indeks 4. Probabilitas 5.
Variabel Acak SPRING 1.
Distribusi normal dan terkait 2.
Estimasi

3. Interval Keyakinan dan Uji Hipotesis 4. Regresi Kuadrat


Terkecil Bivariat 5. Aljabar Matriks & Regresi Berganda 6.
Sifat Estimasi Kuadrat Terkecil 7. Uji Regresi 8. Dinamika
9. Aplikasi 10. Revisi Kelas Tutorial dijalankan hingga suku
musim semi, mengerjakan latihan di

seksi 2.
Bagian-bagian dalam catatan tentang Data Ekonomi dan Keuangan dan Latihan
Terapan, akan digunakan sebagai contoh di berbagai poin dalam kuliah. Anda harus
mengerjakannya, di mana mereka datang dalam urutan dalam catatan. Materi ini akan
berguna untuk latihan kelas, soal ujian dan proyek Anda.

1.3. Hasil pembelajaran

Siswa akan dapat menunjukkan bahwa mereka dapat:

Jelaskan bagaimana ukuran variabel ekonomi dan keuangan seperti PDB,


pengangguran dan angka indeks seperti RPI dan FTSE dibangun, menyadari
keterbatasan data dan mampu menghitung statistik turunan dari data, misalnya rasio,
pertumbuhan suku bunga riil, suku bunga riil, dll.

Gunakan spreadsheet untuk membuat grafik data dan menghitung statistik ringkasan
dan dapat menginterpretasikan grafik dan statistik ringkasan.

Gunakan aturan probabilitas sederhana yang melibatkan probabilitas gabungan,


marjinal dan bersyarat, nilai dan varians yang diharapkan, dan gunakan probabilitas
dari distribusi normal.

4
Machine Translated by Google

Menjelaskan prinsip dasar pendugaan dan pengujian hipotesis.

Turunkan penaksir kuadrat terkecil dan tunjukkan sifat-sifatnya.

Menafsirkan keluaran regresi sederhana dan melakukan pengujian pada koefisien.

Baca dan pahami artikel menggunakan data ekonomi dan keuangan di tingkat FT atau
Economist.

Melakukan dan melaporkan sepotong penelitian empiris yang menggunakan teknik statistik
sederhana.

1.4. Masukan Anda

Untuk mencapai hasil belajar (dan lulus ujian) membutuhkan banyak pekerjaan mandiri oleh
Anda. Kami akan berasumsi bahwa Anda tahu cara belajar dan bahwa ada hal-hal yang tidak
perlu kami sampaikan kepada Anda karena Anda dapat mengerjakannya atau mencarinya sendiri.
Satu-satunya cara untuk mempelajari teknik ini adalah dengan menggunakannya.

Baca catatan ini.

Kenali data ekonomi dan keuangan dengan membaca surat kabar (FT adalah yang terbaik,
tetapi bagian Sunday Business bagus), The Economist, dll.
Dalam melihat artikel perhatikan bagaimana mereka menyajikan Tabel dan Grafik; data apa yang mereka
gunakan; bagaimana mereka menggabungkan data dengan analisis; bagaimana mereka menyusun
artikel. Anda akan membutuhkan semua keterampilan ini, jadi pelajarilah dengan membaca dengan cermat.

Pastikan Anda dapat menggunakan spreadsheet, seperti Excel.

Cobalah untuk menghadiri semua kuliah dan kelas, jika Anda harus melewatkannya
pastikan Anda tahu apa yang mereka bahas dan dapatkan salinan catatan dari siswa lain.

Lakukan latihan untuk kelas di musim semi terlebih dahulu. Tinjau terus materi dalam
kuliah, kelas dan catatan ini, bekerja dalam kelompok jika Anda bisa.

Identifikasi kesenjangan dalam pengetahuan Anda dan ambil tindakan untuk mengisinya,
dengan mengajukan pertanyaan kepada dosen atau wali kelas dan dengan mencari di buku
teks. Kami siap menjawab pertanyaan selama jam kerja (diposting di pintu kami) atau
melalui email.

5
Machine Translated by Google

Lakukan latihan yang diterapkan (bagian 8 dari catatan) selama semester pertama. Kami akan
berasumsi bahwa Anda telah melakukannya dan mendasarkan pertanyaan ujian di atasnya.

Mulailah mengerjakan proyek Anda di awal semester kedua, saran tentang ini ada di bagian 4.

1.5. Membaca

Ada banyak buku teks yang bagus tentang statistik pengantar, tetapi tidak ada yang benar-benar cocok
dengan struktur kursus ini. Ini karena kami membahas materi satu tahun yang biasanya tersebar selama
tiga tahun gelar sarjana: data ekonomi dan keuangan di tahun pertama, statistik di tahun kedua, dan
ekonometrika di tahun ketiga. Gunakan indeks dalam buku teks untuk menemukan topik yang dibahas
dalam kursus ini.

Catatan ini merujuk silang statistik pengantar ke Barrow (2009) dan ekonometrika dan statistik yang
lebih maju ke Verbeek (2008). Ini adalah salah satu buku yang digunakan pada MSc mata kuliah
ekonometrika Ekonomi. Ada sejumlah besar buku serupa lainnya, seperti Gujarati dan Porter (2009) dan
Stock and Watson (2009).

Ada berbagai buku latar belakang yang menarik tentang probabilitas dan statistik. Sejarah probabilitas
dapat ditemukan di Bernstein (1996), yang merupakan bacaan yang menghibur seperti halnya buku-buku
umum lainnya tentang probabilitas seperti Gigerenzer (2002), dan Taleb (2004, 2007). Klasik dalam
menyajikan grafik adalah Tufte (1983).
Di mana topik ekonomi atau keuangan muncul dalam catatan ini, mereka dijelaskan.
Tetapi juga berguna untuk melakukan beberapa bacaan umum. Di bidang ekonomi ada berbagai paperback
yang ditujukan untuk pembaca umum seperti Kay (2004) dan Smith (2003).
Demikian pula, ada banyak paperback tentang keuangan yang ditujukan untuk pembaca umum.
Mandelbrot dan Hudson, (2005) sangat baik. Mandelbrot seorang matematikawan yang menemukan fraktal
telah melakukan pekerjaan mendasar di bidang keuangan sejak tahun 1960-an. Meskipun dia sangat kritis
terhadap banyak teori keuangan modern, dia memberikan posisi eks yang sangat baik tentang itu. Das
(2006) memberikan pengantar non-teknis yang sangat baik untuk derivatif, serta banyak deskripsi lucu dan
sering cabul tentang seperti apa kehidupan sebenarnya di pasar keuangan. Meskipun ditulis sebelum krisis
kredit Taleb, Mandlrot dan Das semuanya menunjuk pada bahaya peristiwa semacam itu.

Referensi
Barrow, Michael, 2009) Statistik Ekonomi Akuntansi dan Studi Bisnis
yaitu, edisi ke-5, FT-Prentice Hall.

6
Machine Translated by Google

Bernstein, Peter L. (1996) Melawan Dewa, Kisah Risiko yang Luar Biasa, Wiley.

Das, Satyajit (2006) Pedagang Senjata dan Uang, Pearson


Gigerenzer, Gerd (2002) Reckoning with Risk, Penguin.
Gujarati DN dan DC Porter, (2009) Ekonometrika Dasar, edisi ke-5. Mc Graw Hill Kay,
John (2004) Kebenaran tentang Pasar, Penguin Mandelbrot, Benoit dan Richard Hudson,
(2005) Perilaku (Yang Salah) dari Buku Profil Pasar Smith, David (2003) Makan Siang
Gratis, Stok Buku Profil, JH dan MW Watson (2007) Pengantar Ekonometrika, edisi ke-2,
Pearson-Addison Wesley.

Taleb, Nassim Nicholas (2004) Tertipu oleh Keacakan: peran tersembunyi dari kesempatan
dalam hidup dan di pasar, 2nd edition, Thomson Taleb, Nassim Nicholas (2007) The Black
Swan: Dampak dari yang sangat
tidak mungkin, Penguin.
Tufte, Edward R (1983) Tampilan Visual Informasi Kuantitatif, Graphics Press Verbeek,
Marno (2008) A guide to modern econometrics, 3rd edition, Wiley.

7
Machine Translated by Google

2. Latihan kelas Semester musim semi (Banyak yang melewati pertanyaan ujian
tion).
2.1. Statistik Deskriptif Minggu 1

(1) Dalam pidatonya, Why Banks failed the stress test, Februari 2009, Andrew Haldane
dari Bank of England memberikan ringkasan statistik berikut untuk "emas"
era" 1998-2007 dan untuk waktu yang lama. Pertumbuhan adalah persen pertumbuhan PDB tahunan,
ináation adalah persentase perubahan tahunan dalam RPI dan untuk kedua periode panjang adalah
1857-2007. FTSE adalah persentase perubahan bulanan dalam semua indeks saham dan
periode panjang adalah 1693-2007.

Ináation FTSE
panjang 98-07 2.0 panjang 98-07 panjang
Pertumbuhan 98-07 2.8 3,1 0,2 0,2
Rata-rata 2,9 Miring
SD 0,6 2,7 0,9 -0,8 5.9 4.1 4.1
0,2 Kurtosis -0,8 0,0 1.2 -0.8 2.6
2.2 -0,3 3.0 3.8 62.3

(a) Jelaskan bagaimana meannya; simpangan baku, SD; koefisien kemiringan dan
koefisien kurtosis dihitung.
(b) Berapa nilai koefisien skewness dan kurtosis yang Anda harapkan dari distribusi normal. Manakah
dari deret yang menunjukkan bukti paling sedikit dari
normalitas.
(c) Haldane mengatakan "distribusi ini menunjukkan bahwa distribusi Era Emas" memiliki varians
yang jauh lebih kecil dan ekor yang lebih ramping" dan "banyak model manajemen risiko yang
dikembangkan dalam sektor swasta selama dekade emas adalah,
akibatnya, diprogram sebelumnya untuk menginduksi miopia bencana.". Jelaskan apa yang dia maksud.

(2) Nilai akhir yang Anda dapatkan pada kursus ini (gagal, lulus, pantas, istimewa) adalah
ringkasan statistik. 40-59 adalah pass, 60-69 adalah merit, 70 ke atas adalah perbedaan.
Di Grad Dips, nilai didasarkan pada nilai (beberapa di antaranya rata-rata) di 5
elemen. Merit atau lebih baik adalah kriteria untuk memasuki MSc.
Nilai keseluruhan akhir diberikan sebagai berikut:
Distinction: Lulus (atau lebih baik) di semua elemen, dengan tanda Distinction di tiga
elemen dan tanda Merit (atau lebih baik) di keempat.
Merit: Lulus (atau lebih baik) di semua elemen, dengan tanda Merit (atau lebih baik) di empat
elemen.

8
Machine Translated by Google

Lulus: Untuk mendapatkan nilai Lulus, seorang siswa harus mengikuti semua ujian
dan dapatkan tanda Lulus (atau lebih baik) dalam setidaknya empat elemen.
Perhatikan bahwa nilai tidak didasarkan pada rata-rata. Ini seperti tes mengemudi.
Jika Anda rata-rata bagus, bagus dalam kemudi dan akselerasi, buruk dalam pengereman, Anda
gagal; setidaknya di Inggris.
Simak empat kandidat berikut ini.
M ac M ic QT AES Memilih 80 80
30 80 80 b 80 80 40 80 80 c 60 60 40
60 60 d 80 80 80 30 30 (a) Berapa
nilai akhir yang akan diperoleh masing-
masing? (b) Bagaimana aturan nilai
berdasarkan mean, median atau modus
berbeda. (c) Menurut Anda, penjelasan apa yang ada untuk aturan tersebut?
Apakah menurut Anda mereka masuk akal?

2.2. Minggu 2 Probabilitas

(1) Tunjukkan bahwa varians sama dengan mean kuadrat dikurangi kuadrat mean:

N N
2 2 2
N 1X (xi x) = N 1X x saya (x)
saya = 1 saya = 1

di mana x = Pxi=N: (2)


Misalkan Anda melempar koin yang adil tiga kali berturut-turut. Berapakah peluangnya?
dari:

(a) tiga kepala berturut-turut;


(b) ekor diikuti oleh dua kepala. (c)
setidaknya satu ekor dalam tiga lemparan.
3
Petunjuk menulis 8 (2 ) kemungkinan hasil dan hitung berapa banyak yang terlibat
dalam setiap kasus.

(3) Siswa mengikuti dua ujian A dan B. 60% lulus A, 80% lulus B, 50% lulus keduanya.

(a) Isi sisa lima elemen dari distribusi gabungan dan marginal
di bawah ini, di mana PA menunjukkan lulus A, FB gagal B, dll.
(b) Berapa peluang seorang siswa lulus B jika mereka lulus A?

9
Machine Translated by Google

(c) Apakah dua kejadian yang melewati A dan melewati B (i) saling lepas (ii) bebas?

PA FA B PB
50 FB A 60 80

100

2.3. Minggu 3 Probabilitas Berlanjut

(1) Perhatikan permainan berikut. Sebuah koin yang adil dilempar sampai muncul kepala dan
Anda dibayar £ (2 n ) jika muncul kepala pada lemparan ke-n. Jika muncul kepala pertama kali
Anda mendapatkan £ 2 dan permainan berhenti. Jika muncul kepala, untuk pertama kalinya pada
lemparan kedua Anda mendapatkan £ 4=(2)2 dan permainan berhenti; dan seterusnya. Berapa
nilai yang diharapkan dari game ini? Berapa banyak yang akan Anda bayar secara pribadi untuk
memainkannya?

(2) Definisikan P(A) sebagai peluang terjadinya peristiwa A; P(B) peluang terjadinya peristiwa
B; P(A \ B) peluang terjadinya A dan B; P(A[B) peluang terjadinya A atau B; dan P(Aj B) peluang
terjadinya A dengan syarat B telah terjadi. (a) Berapa P(A \ B) jika A dan B saling lepas. (b) Berapa
P(A \ B) jika A dan B saling bebas? (c) Apakah P(A [ B) itu? (d) Tunjukkan bahwa

P(Bj A)P(A)
P(Aj B) = :

P(B)

(3) Anda berada di acara kuis AS. Tuan rumah menunjukkan kepada Anda tiga kotak tertutup
di mana salah satunya ada hadiah. Tuan rumah tahu di kotak mana hadiah itu berada, Anda tidak.
Anda memilih sebuah kotak. Tuan rumah kemudian membuka kotak lain, bukan yang Anda pilih, dan
menunjukkan bahwa kotak itu kosong. Dia selalu bisa melakukan ini. Anda dapat tetap menggunakan
kotak yang awalnya Anda pilih atau mengubahnya ke kotak lain yang belum dibuka. Apa yang harus
Anda lakukan: tetap atau berubah? Berapa peluang bahwa hadiah ada di kotak lain yang belum
dibuka?

(4) (Opsional). Hitung peluang bahwa dua orang dalam kelompok berukuran N akan memiliki
hari ulang tahun yang sama. Berapa ukuran kelompok yang Anda butuhkan agar ada peluang
50% bahwa dua orang akan memiliki hari ulang tahun yang sama? Abaikan tahun kabisat.

10
Machine Translated by Google

Gunakan spreadsheet untuk ini dan kerjakan dalam hal kemungkinan tidak memiliki ulang
tahun yang sama. Di baris pertama kita akan memberikan nilai untuk N (jumlah orang dalam
kelompok), di baris kedua kita akan menempatkan probabilitas bahwa tidak ada dua orang
dalam kelompok dengan ukuran yang sama yang memiliki tanggal lahir yang sama.
Di A1 put 1, di B1 put =A1+1, salin ini ke kanan ke Z1.
Di A2 taruh 1. Sekarang di B2 kita perlu menghitung probabilitas bahwa dua orang TIDAK
akan memiliki tanggal lahir yang sama. Ada 364 hari yang mungkin, yaitu hari apa saja kecuali
hari ulang tahun orang pertama, jadi peluangnya adalah 364/365. Jadi masukkan B2 =A2*(365-
A1)/365. Salin ini dengan benar. Pergi ke C2, rumusnya akan memberi Anda 1 (364=365)
(363=365): Orang ketiga, harus memiliki ulang tahun yang berbeda dari orang pertama dan
kedua. Ikuti terus sampai kemungkinan tidak ada dua orang yang memiliki ulang tahun yang
sama turun di bawah setengah.

2.4. Minggu 4 Nomor indeks dll.

(1) PDB Inggris dalam harga pasar saat ini pada tahun 1995 adalah £712.548 juta, sedangkan pada tahun
1997 adalah £801.972 juta. PDB pada harga pasar 1995 konstan pada tahun 1997 adalah £ 756.144m.
(a) Susun angka indeks, 1995=100 untuk: PDB harga berlaku; harga konstan
PDB; dan deáator PDB pada tahun 1997.
(b) Dari angka-angka ini hitunglah rata-rata tingkat inflasi tahunan antara tahun 1995 dan
1997. (c) Dari angka-angka tersebut hitunglah rata-rata tingkat pertumbuhan tahunan antara
tahun 1995 dan 1997. (d) Jika tingkat bunga obligasi dua tahun pada tahun 1995 adalah
10% per tahun berapa?

akankah tingkat bunga riil per tahun selama periode ini.


(e) Jelaskan perbedaan antara Produk Domestik Bruto dan Produk Nasional Bruto. (f)
Jelaskan apa yang diukur Produk Domestik Bruto. Keterbatasan apa yang dimilikinya sebagai
ukuran kesejahteraan ekonomi suatu bangsa.

(2) Departemen membeli sebotol anggur merah, anggur putih, dan jus jeruk untuk pestanya.
Tabel di bawah ini memberikan harga per botol dan jumlah botol selama tiga tahun. Bangun:
(a) indeks pengeluaran menggunakan 1995=100; (b) indeks harga partai (i) menggunakan 1995
sebagai dasar (Laspeyres), (ii) menggunakan 1997 sebagai dasar (Paasche); (c) indeks
kuantitas menggunakan 1995 sebagai basis.

11
Machine Translated by Google

1995 1996 1997


pqpqpq
Merah 3 20 4 15 5 10 :

Putih 4 20 4 25 4 30
Oranye 1 10 2 10 3 10

2.5. Minggu 5 Sifat estimator dan distribusi.


2
(1) Misalkan Anda memiliki sampel data, Yi ; saya = 1; 2; ::; N; dimana Y IN( ; (a) ):
2
Jelaskan apa yang dimaksud dengan Y IN( ; ).
2
(b) Bagaimana Anda mendapatkan estimasi tak bias dan rata- ? Jelaskan apa yang
rata bias.
(c) Bagaimana Anda memperkirakan kesalahan standar dari perkiraan Anda?
(d) Misalkan distribusi sampel Anda tidak normal tetapi sangat
miring. Jelaskan apa artinya ini dan diskusikan apa langkah-langkah lain dari pusat
kecenderungan yang mungkin Anda gunakan.

(2) Nilai pada ujian berdistribusi normal dengan nilai harapan 50 dan
simpangan baku 10.
(a) Berapa proporsi yang diperoleh siswa?
(i) <30;
(ii) antara 30 dan 50;
(iii) lebih dari 50.
(b) Berapa nilai yang dibutuhkan seorang siswa untuk masuk ke dalam 15% teratas.
(c) Di kelas yang terdiri dari 16 orang, berapa peluang mendapat nilai rata-rata lebih besar?
dari 53?

2.6. Minggu 6 Pengujian Hipotesis dan Regresi


2
(1) Untuk sampel data Y1; Y2; :::; YN pada variabel acak Y IN( ; (a)Anda ):
ingin menguji hipotesis yang sama dengan nilai tertentu Hai
: Bagaimana

apakah Anda akan menguji hipotesis ini?


(b) Jelaskan kesalahan Tipe I dan Tipe II. Bagaimana Anda menangani kedua tipe ini?
kesalahan dalam jawaban Anda untuk (a)?
(c) Misalkan Anda ingin menghitung probabilitas mengamati suatu nilai
dari Y lebih besar dari nilai tertentu Y0. Bagaimana Anda akan melakukan ini?

12
Machine Translated by Google

(2) Perhatikan model regresi bivariat berikut:


Yi = + Xi + ui
diestimasi pada sampel data i = 1; 2; :::; N, di mana Yi adalah variabel dependen yang
diamati, Xi adalah regressor eksogen yang diamati, ui adalah gangguan yang tidak teramati,
dan dan merupakan parameter yang tidak diketahui. (a) Turunkan estimator kuadrat terkecil
untuk dan : (b) Berdasarkan asumsi apa tentang ui penaksir kuadrat terkecil ini menjadi
Tak Bias Linier Terbaik.

(c) Jelaskan apa yang dimaksud dengan Best Linear Unbiased.


(d) Jelaskan apa yang dimaksud dengan eksogen.

2.7. Minggu 7, Regresi

Diyakini bahwa persamaan permintaan energi berbentuk:

qt = + yt + pt + "t ;

di mana qt adalah logaritma dari permintaan energi per kapita pada tahun t; pt logaritma harga
energi riil; yt logaritma dari PDB riil per kapita; "t adalah istilah gangguan berperilaku baik.
Estimasi berikut (dengan kesalahan standar dalam tanda kurung) diperoleh dengan
menggunakan data untuk periode t = 1974-1990.
R2 SER
India 1:006 0:068 0:38 0:027
(0:102) (0:080) 1:564 0:488 0:52
Indonesia 0:034 (0:234)
0:136
(0:195)
0 :541:074
0:031
(0:125) (0:189)
Korea

SER adalah kesalahan standar dari regresi. (a)


Bagaimana Anda menafsirkan dan ? (b) Jelaskan
apa itu R2 dan SER dan apa yang mereka katakan kepada Anda. Bagaimana Anda
menafsirkan fakta bahwa meskipun Korea memiliki R2 terbesar , namun tidak memiliki SER
terendah?
(c) Untuk Indonesia, uji (i) hipotesis = 1 dan (ii) hipotesis = 0: (d) Interpretasikan komponen
stokastik model. Bagaimana Anda memperkirakannya?

(e) Misalkan Anda percaya bahwa ada tren peningkatan energi e¢ -


ciency di negara-negara tersebut. Bagaimana Anda menyesuaikan model untuk memungkinkan ini.

13
Machine Translated by Google

2.8. Minggu 8, Regresi

Pertimbangkan model regresi linier

y = X+ u

di mana y adalah vektor T 1 pengamatan pada variabel dependen, X peringkat penuh T k


matriks pengamatan pada variabel eksogen yang ditetapkan, ak 1 vektor koefisien yang
2
tidak diketahui, dan u gangguan yang tidak teramati dengan E(u) = 0 dan E(uu0 ) =
b
SAYA:

(a) Turunkan penduga kuadrat terkecil : (b)


Turunkan matriks kovarians varians dari b. (c)
b

Tunjukkan bahwa tidak bias.

2.9. Minggu 9, Regresi

Kurva Phillips asli membuat tingkat persentase pertumbuhan upah uang, wt sebagai fungsi
dari tingkat persentase pengangguran ut . Selanjutnya, Friedman dan yang lainnya
berpendapat bahwa seharusnya tingkat pertumbuhan upah riil yang diharapkan yang
wt p te merupakan fungsi dari tingkat pengangguran, di mana p adalah tingkat
e
t yang
inflasi
diharapkan. Misalkan inflasi yang diharapkan sama dengan inflasi aktual pada tahun
sebelumnya, p = pt1tedan
daribahwa tingkat pertumbuhan
pengangguran. upahmodel
Kemudian, baik merupakan
Phillipsfungsi timbal balik
dan Friedman
dapat dianggap sebagai kasus khusus dari:

wt = + (1=ut) + pt1 + "t ;

di mana "t diasumsikan sebagai istilah kesalahan berperilaku baik. Persamaan ini diperkirakan
menggunakan data Inggris untuk t = 1967 hingga 1987. Hasilnya adalah:
berat = 3:86 + 7:24 (1=ut) + 0:65 pt1 (5:20) (0:15)
(2:17)
R2 = 0:534; SER = 3:20: Kesalahan standar diberikan dalam tanda kurung, SER adalah
kesalahan standar regresi. (a)
Apa yang dimaksud dengan istilah kesalahan
berperilaku baik. (b) Prediksi apa yang tersirat oleh (i) teori 'upah uang' Phillips dan (ii)
teori 'upah riil' Friedman? (c) Uji hipotesis yang = 0. (d) Uji hipotesis (i) bahwa = 0; (ii) bahwa
= 1. (e) Apa yang akan Anda simpulkan tentang pentingnya pengangguran dan?

ekspektasi inflasi pada periode ini.

14
Machine Translated by Google

2.10. Minggu 10, Regresi.

Menggunakan data AS tentang pendapatan ; dan dividen yang dibayarkan untuk dibagikan
pemegang, tanda
; perusahaan,
kurung Dt ):Et t = 1872-1986 diperoleh hasil berikut (kesalahan standar dalam

Dt = 0.011+ 0.088Et+ 0:863Dt1 +ub1t (0:009) (0:008)


(0:019)
R2 = 0:998; SER = 0.074:

ln Dt = 0.136+ 0:312 ln Et+ 0:656 ln Dt1 +ub2t (0:015) (0:025)


(0:029)
R2 = 0:993; SER = 0.085:

SER adalah kesalahan standar regresi. (a) Uji


apakah perpotongan pada setiap persamaan berbeda nyata dari
nol pada tingkat 5% dan menafsirkannya. Apakah mereka memiliki nilai-nilai yang masuk akal?
(b) Disarankan bahwa persamaan linier adalah persamaan yang lebih baik daripada loga ritmik
karena memiliki R2 yang lebih tinggi : Apakah Anda setuju dengan ini?
Menafsirkan peran variabel dependen tertinggal dan menghitung efek jangka panjang dari
pendapatan dividen dalam setiap kasus. (c) Uji korelasi serial orde kedua memiliki nilai p 0,008 pada
model linier dan 0,161 pada model logaritmik. Jelaskan apa yang dimaksud dengan korelasi serial
urutan kedua dan mengapa itu menjadi masalah. Apakah ini masalah di salah satu model ini?

pertanyaan tambahan
1. Dari pengamatan yang dilakukan selama bertahun-tahun ditemukan bahwa nilai pada ujian
tertentu terdistribusi normal dengan nilai harapan 50 dan varians 100. Untuk distribusi normal standar
Pr(Z < z) =0,6915 untuk z=0,5; 0,8413 untuk z=1; 0,9332 untuk z = 1,5; 0,9772 untuk z=2. (a) Berapa
peluang seorang siswa mendapat nilai di bawah 40 pada ujian ini? (b) Berapa peluang seorang siswa
mendapatkan nilai di bawah 30 pada ujian ini? (c) Misalkan di kelas yang terdiri dari 16 siswa,
metode pengajaran baru digunakan dan nilai rata-rata di kelas ini adalah 54. Apakah ini bukti yang
signifikan secara statistik, pada tingkat 5%, bahwa metode baru lebih efektif? Misalkan rata-rata
54 telah diperoleh dalam kelas yang terdiri dari 36 siswa, apakah ini merupakan bukti yang signifikan
secara statistik? Asumsikan bahwa metode pengajaran baru tidak mengubah varians.

15
Machine Translated by Google

(d) Tunjukkan bahwa rata-rata aritmatika adalah penaksir tak bias dari yang diharapkan
nilai.
(e) Berikan contoh jenis distribusi di mana mean aritmatika
tidak akan menjadi ukuran yang baik dari nilai khas dari variabel acak.

2. Data berikut diambil dari Economic Trends Annual Supplement


1999.
kamu C RC TBY
1995 494.574 454.171 454.171 6.31
1996 521.281 485.418 470.622 6.26
1997 554.641 517.032 488.936 7.13
1998 565.935 545.124 505.367 5,63
Y adalah pendapatan disposabel rumah tangga bruto pada harga berlaku, C adalah rumah tangga
pengeluaran konsumsi akhir pada harga berlaku, RC adalah pengeluaran konsumsi
pada harga 1995, TBY adalah Yield Treasury Bill dalam persen.
(a) Hitung indeks harga untuk konsumsi 1995 sampai 1998, 1995=100.
(b) Hitung laju inflasi untuk tahun 1996, 1997 dan 1998.
(c) Hitung tingkat bunga riil ex post untuk tahun 1995, 1996 dan 1997.
(d) Hitung tingkat tabungan untuk tahun 1995 sampai 1997.
(e) Apakah tampaknya ada hubungan antara tingkat tabungan dan
suku bunga riil? Hubungan apa yang Anda harapkan?

3. Tersedia data jumlah barang yang dikonsumsi Qt ; pendapatan yang sebenarnya


Yt ;harga Pt yang bagus ; dan rata-rata dari semua harga lainnya P t selama bertahun-tahun

t = 1; 2; :::; T: Fungsi permintaan diasumsikan berbentuk

Qt = AY P t1 P2 _ eut
t

di mana ut adalah istilah kesalahan acak.


(a) Bagaimana Anda memperkirakan parameter dengan kuadrat terkecil?
(b) Bagaimana Anda menginterpretasikan parameter dan tanda apa yang Anda harapkan?
untuk mereka?

(c) Bagaimana Anda menguji hipotesis (d) 1+ 2


= 0?
Bagaimana Anda menafsirkan hipotesis ini?

16
Machine Translated by Google

2.11. Jawaban untuk latihan yang dipilih

2.11.1. Minggu 2, pertanyaan 1.

Catatan
2 2 2
( xx) =xi +x + 2xxi
22
dan bahwa x adalah konstanta, tidak berubah dengan i; jadi Px = Nx

N
2 1
+ N 1Nx 2 N
N 1X (xi x) = N 1Xx 2 saya
2x Xxi
saya = 1

= N 1Xx 2 saya
2+x 2 2x

2x
= N 1Xx 2 saya

2.11.2. Minggu 3, pertanyaan 1.

Ini adalah paradoks St Petersburg. Nilai yang diharapkan tidak terbatas, tetapi hanya sedikit yang
akan membayar jumlah uang yang tidak terbatas untuk memainkannya. Penjelasan biasa adalah
dalam hal utilitas marjinal uang yang semakin berkurang, yang membuat utilitas yang diharapkan
dari permainan kurang dari tak terhingga..

2.11.3. Minggu 3, pertanyaan 2.

Misalkan Anda memilih A untuk memulai. Pertimbangkan dua strategi, tongkat S; atau ubah C: Jika
hadiah ada di A, tuan rumah dapat membuka kotak B atau C dan menunjukkan bahwa kotak itu kosong.
Anda menang dengan S; bertahan dengan kotak A dan kalah dengan C, mengubah ke kotak
yang tuan rumah tidak dibuka: Jika hadiahnya ada di B, tuan rumah harus membuka kotak C.
Anda kalah dengan S; menang dengan C; karena Anda harus mengubah ke kotak B; kotak C
terbuka. Jika hadiahnya di C, tuan rumah harus membuka kotak B. Anda kalah dengan S;
menang dengan C karena Anda mengubah ke kotak C, kotak B terbuka: Mengubah adalah
strategi optimal karena Anda menang 2 kali dari tiga dan kemungkinan hadiah ada di kotak lain adalah 2/3.
Hal ini juga dapat ditunjukkan oleh teorema Bayes. Misalkan WA adalah kejadian dimana hadiah
berada di kotak A, dll. Misalkan HA adalah kejadian dimana tuan rumah membuka kotak A, dll.
Misalkan Anda memilih kotak A. Probabilitas bahwa Anda memenangkan hadiah jika Anda beralih
adalah probabilitas bahwa hadiahnya ada di B dan tuan rumah membuka C ditambah probabilitas bahwa

17
Machine Translated by Google

hadiahnya ada di C dan tuan rumah membuka B

P(WB \ HC) + P (WC \ HB)


= P(WB)P(HC j WB) + P(WC)P(HB j WC) 2 1 = 3
1
= 11+3
3

Baris kedua mengikuti dari definisi probabilitas bersyarat. Rumus ini mungkin tampak rumit,
tetapi muncul dalam karya remaja yang sangat populer ction: Insiden aneh anjing di malam hari,
oleh Mark Haddon, Ran dom House, 2003.

2.11.4. Minggu 7.

(a) adalah elastisitas pendapatan dari permintaan energi, adalah elastisitas harga.
2 2
(b) R2 = 1 Pb" t = P( qtq) ; SER = qPb" 2 t =T k dimana k = 3 disini.
R2 mengukur t relatif terhadap varians variabel dependen, SER hanya mengukur t. Peringkat
hanya akan sama jika semua variabel dependen memiliki varians yang sama. (e) Sertakan tren
waktu

qt = + yt + pt + t + "t ;

2.11.5. Minggu 10

(a) Perpotongan persamaan linear memiliki rasio t 0,011/0,009=1,22 tidak berbeda nyata dengan
nol. Perpotongan dalam persamaan log memiliki rasio t -0,136/0,015=-9,06 yang signifikan
berbeda dari nol. Intersep mengukur hal yang berbeda dalam dua persamaan. Lihat (c) di bawah.

(b) Tidak, R2 tidak dapat dibandingkan karena variabel dependennya berbeda. (c) Variabel
dependen yang tertinggal menangkap efek bahwa dividen halus perusahaan dan hanya
menyesuaikannya secara perlahan dalam menanggapi perubahan pendapatan. Hubungan
jangka panjang adalah

0:011 0:088
D= + 1 0:863 1 E
0:863
= 0:080 + 0,642E

18
Machine Translated by Google

0:136 0:312
ln D = ln E
+ 1 0:656 1 0:656
= 0:395 + 0:91 ln E

Dalam kasus model linier intersep jangka panjang harus nol, dividen harus nol ketika
pendapatan nol, dalam kasus logaritmik itu adalah konstanta proporsionalitas exp (0:395) =
0:67 jadi jangka panjang adalah
0:91
D = 0:67E :

(d) Korelasi serial orde kedua adalah hubungan antara residual dari bentuk

ut = 1ut1 + 2ut2 + et Ini


adalah masalah karena ini menunjukkan model mungkin salah spesifikasi. Nilai p model
linier menunjukkan bahwa ada korelasi serial p<0,05, nilai p model logaritmik menunjukkan
bahwa kemungkinan tidak ada korelasi serial, p>0,05, pada tingkat 5%.

2.11.6. Jawaban untuk pertanyaan tambahan

1.a (40-50)/10=-1, P(Z<-1)=P(Z>1)=1-P(Z<1)=1-0,8413=0,1587 1.b (30-50 )/


10=-2, P(Z<-2)=1-P(Z<2)=1-0.9772=0.0228 1.c Uji statistik untuk N=16,
pN=4
54 50 =
1:6
10=4 Ini tidak

berbeda nyata dari nol pada tingkat 5%. Untuk N=36


54 50 =
3:6
10=6

Ini berbeda secara signifikan dari nol pada tingkat 5%.


1d Misalkan E(X) = maka Xi = + ui dengan E(ui) = 0
N N N

ui
X = N 1X Xi = N 1X ( + ui) = + N 1X
saya = 1 saya = 1 saya = 1

jadi
N

E(X) = + E(N 1X ui) =


:

saya = 1

19
Machine Translated by Google

1e Dalam setiap distribusi yang sangat miring, seperti pendapatan, rata-ratanya bisa
sangat berbeda dari biasanya, jadi modusnya<median<mean.

2.a Indeks harga untuk konsumsi adalah Pt = 100 Ct=RCt ; Inaasi = 100 (Pt Pt1 )=Pt1;
suku bunga riil ex post adalah RIR = T BRt It+1 Suku Bunga Tabungan adalah SR = 100(1
C=Y ): Jadi Y ear Pt It RIR SR 1995 100 3:21 8:16 1996 103:1 3:1 3:76 6:88 1997 105:7 2:5
5:03 6:78 1998 107:9 2:1

Tingkat bunga riil meningkat, sementara tingkat tabungan turun, kebalikan dari apa yang
diharapkan.
3. (a) Pertama ambil logaritma kemudian perkirakan
dengan LS. (b) Elastisitas pendapatan dari permintaan > 0 (untuk barang normal); harga
lain elastisitas1 >
sendiri
0 (tidak
< 0bisa
(bukan
menjadi
barang
komplemen
Gi§en); elastisitas
dengan semua
harga barang
silang dengan
lain). (c)semua
Parameterisasi
barang
2 ulang persamaan taksiran sebagai

ln Qt = a + ln Yt + 1 (linPt ln P t )+(2 1 ) Dalam Pt + ut

dan melakukan uji hipotesis bahwa koefisien ln P t adalah nol.

(d) Hanya harga relatif yang penting.

20
Machine Translated by Google

3. Asesmen dan ujian spesimen.


3.1. Penilaian

Penilaian adalah 70% pada ujian, 30% pada proyek empiris yang diajukan pada pertengahan Mei.
Anda harus membaca saran untuk mengerjakan proyek di awal kursus untuk mendapatkan gambaran
umum tentang apa yang kami cari dan kemudian merujuk kembali padanya secara teratur saat Anda
mengerjakan proyek Anda.
Ujian akan memiliki enam pertanyaan, tiga pertanyaan pertama ada di Bagian A, tiga pertanyaan
terakhir ada di Bagian B dan lebih banyak diterapkan. Anda harus mengerjakan tiga pertanyaan:
setidaknya satu dari setiap bagian dan satu lainnya. Pertanyaannya akan tentang:

1. Kuadrat Terkecil, misalnya menurunkan estimator kuadrat terkecil dan matriks kovarians
variansnya, membuktikan bahwa itu adalah Penaksir yang tidak bias, dll. Ini akan menjadi
satu-satunya pertanyaan yang membutuhkan aljabar matriks.

2. Interpretasi statistik yang terkait dengan regresi, misalnya R2 ; kesalahan


standar regresi, tes diagnostik seperti statistik Durbin-Watson dan efek dari kegagalan
berbagai asumsi.

3. Pengujian hipotesis, misalnya menjelaskan dasar pengujian yang diterapkan baik terhadap rata-
rata atau koefisien regresi.

4. Data ekonomi dan keuangan, ini akan melibatkan perhitungan, misalnya angka indeks, tingkat
pertumbuhan, rasio, ukuran turunan dan beberapa interpretasi.

5. Interpretasi hasil regresi yang diberikan kepada Anda dalam pertanyaan.

6. Probabilitas dan distribusi, misalnya mampu menggunakan aturan dasar kemampuan prob;
diberikan rata-rata dan varians untuk distribusi normal, hitung probabilitas berbagai peristiwa
yang terjadi, dll.

Sebelum tahun 2004 ada ujian terpisah untuk Keuangan dan Statistik Terapan dan Ekonomi dan
Statistik Terapan. Contoh pertanyaan 1 dapat ditemukan di AFS, meskipun bukan makalah AES;
contoh pertanyaan 4 dapat ditemukan di AES tetapi tidak di kertas AFS. Contoh pertanyaan lain
muncul di keduanya.
Ujian 2004, dengan jawaban diberikan di bawah ini.

21
Machine Translated by Google

3.2. Ujian Spesimen (2004)

Jawab TIGA Pertanyaan, setidaknya satu dari setiap bagian dan satu lainnya. Semua
pertanyaan berbobot sama.

BAGIAN A

1. Pertimbangkan modelnya:

yt = 1 + 2x2t + ut

pada variabel bebas


T: dimana
non-stokastik,
yt adalah pengamatan
ut adalah gangguan
pada variabel
yang tidak
terikat
teramati,
dan x2t pengamatan t = 1; 2; :::;

dengan E(ut) = 0; dan merupakan


1 parameter
2 yang tidak diketahui.
(a) Tentukan sistem persamaan T dalam bentuk matriks y = X+ u di mana y dan
u adalah vektor T 1, X adalah matriks T 2, dan merupakan vektor 2 1.
2 dalam matriks
(b) Bagaimana Anda menyatakan jumlah residu kuadrat PT t=1 t
kamu

membentuk. Tunjukkan bahwa ini adalah fungsi dari :

(c) Tunjukkan bahwa penaksir kuadrat terkecil dari diberikan oleh


b

= (X 0X) 1X 0 aku:

(d) Tunjukkan bahwa tidak bias, yaitu E(b) = :

2. Data AS 1971-1999 digunakan untuk memperkirakan hubungan antara tingkat


bunga Rt dan tingkat inflasi t;

Rt = + t + ut :

Estimasi kuadrat terkecil (dengan kesalahan standar dalam tanda kurung) adalah

Rt = 6:37 +0:33 (0:66) t +ubt


:

(0:10)

Kesalahan standar regresi, s = 2:75, koefisien determinasi R2 =


0:29; dan Statistik Durbin Watson DW = 0:63:
(a) Jelaskan apa yang diukur ubt .
(b) Jelaskan berapa R2 ; Kesalahan Standar Regresi dan Durbin Watson
ukuran statistik dan apa yang mereka katakan tentang regresi ini.
(c) Menafsirkan perkiraan dan : Apa yang mereka katakan tentang hubungan antara inflasi dan suku
bunga?

22
Machine Translated by Google

(d) Asumsi apa yang diperlukan untuk kuadrat terkecil untuk memberikan estimasi yang baik.

(3) Menggunakan informasi pada pertanyaan 2, dan dengan asumsi bahwa nilai kritis 95% untuk
pada pengujian adalah 2 : (a) Uji hipotesis = 0 dan = 1 pada taraf 5%. (b) Jelaskan mengapa hipotesis =
1 mungkin menarik untuk diuji. (c) Jelaskan apa yang dimaksud dengan kesalahan Tipe I dan Tipe
II. Berapakah peluang dari

Kesalahan tipe I dalam pengujian Anda di bagian (a).


(d) Berikan interval kepercayaan 95% untuk b. Jelaskan apa yang dimaksud dengan interval kepercayaan
adalah.

BAGIAN B

4. Data berikut diambil dari Economic Trends, Februari 2004.

NDY RDY RP I CP I HP T BY
2000 654; 649 654; 649 170:3 105:6 87:7 5:69 2001 700; 538 685;
263 173:3 106:9 95:1 3:87 2002 721; 044 696; 224 176:2 108:3
111:2 3:92

NDY adalah pendapatan rumah tangga nominal yang dapat dibelanjakan dalam harga berlaku; RDY adalah
pendapatan rumah tangga riil yang dapat dibelanjakan dalam harga konstan 2000; RP I adalah indeks harga eceran,
1987=100; CP I adalah indeks harga konsumen, 1996=100; HP adalah indeks harga rumah;
T BY adalah Treasury Bill Yield suku bunga jangka pendek yang dinyatakan dalam persen
setiap tahun.
(a) Hitung indeks harga (deáator implisit) untuk pendapatan yang dapat dibelanjakan. (b)
Hitung laju inflasi tahun 2001-2 untuk pendapatan yang dapat dibelanjakan, RP I; CP I;
dan HP: Komentari hubungan di antara mereka.
(c) Misalkan Anda memiliki sebuah rumah, yang harganya meningkat pada tingkat rata-rata, dan
memiliki hipotek 100% yang membayar Tarif Tagihan Perbendaharaan untuk hipotek, berapa
pengembalian riil untuk memiliki rumah selama 2001-2. (d) RPI memasukkan harga perumahan dalam
ukuran inflasinya, CPI tidak
bukan. Haruskah harga rumah dimasukkan dalam langkah-langkah ináation?

5. Anda memiliki data pendapatan rata-rata menurut usia dan pendidikan di AS pada tahun 1991
untuk 30 kelompok pria, i = 1; 2; :::; N: Tentukan
100),logaritma
Ei tahun (dibagi
pendapatan,
100) pendidikan.
umur Ai dalam
Disarankan
tahun (dibagi
model
yang sesuai adalah:

2
wi = + 1Ai + 2Ei + 1A saya
+ 2AiEi + ui :

23
Machine Translated by Google

Koefisien yang diperkirakan, dengan kesalahan standar dalam tanda kurung adalah:
wi = 7:46 +6:6Ai +9:0Ei 6:7A2 +4:1AiEi saya

(0:19) (0:62) (1:01) (1:95) (0:56)

R2 = 0:99; SER = 0:05:


(a) Berapakah komponen stokastik dalam model ini? Bagaimana Anda menafsirkan?
dia?

(b) Jelaskan peran A2 saya


ketentuan?

(c) Komentari hasil ini. Apakah tanda-tandanya seperti yang Anda harapkan?
(d) Mengingat perkiraan parameter ini pada usia berapa pria dengan nol?
dan dua puluh tahun pendidikan mendapatkan jumlah maksimum? Apakah ini masuk akal?
angka?

6. Misalkan Anda memiliki mesin untuk mengisi 1 kilogram kantong gula. Itu
mesin diatur sedemikian rupa sehingga berat tas harus berdistribusi normal secara acak
variabel dengan nilai yang diharapkan dari 1005g dan standar deviasi dari 2g. Untuk sebuah
variabel acak Z dengan normal standar, probabilitas kumulatifnya adalah:
z 0 0:33 0:5 1 1:5 2 2:5
P(Z < z) 0:5 0:6293 0:6915 0:8413 0:9332 0:9772 0:9938

(a) Jelaskan apa yang P(Z < z) katakan kepada Anda.


(b) Berapa probabilitas bahwa sekantong gula akan berbobot (i) kurang dari 1000g
(ii) antara 1004g dan 1006g?
(c) Anda mengambil sampel 16 kantong gula, yang memiliki rata-rata 1004g: Berapa?
adalah (i) kesalahan standar rata-rata dan (ii) probabilitas mendapatkan sampel
rata-rata 1004g atau kurang?
(d) Berdasarkan perkiraan rata-rata ini, apakah Anda akan menyimpulkan bahwa:
mesin masih bekerja dengan benar?
(e) Bagaimana Anda menyelidiki apakah varians mesin mungkin memiliki:
ditingkatkan?

24
Machine Translated by Google

3.3. Jawaban

Pertanyaan 1
(a).
y1 1x21 _ u1
1
2 ::
3 = 2 :: ::
3
+ 2 ::
3
2
4 yT 5 4 1x2T _ 5 4
uT 5

(b). u 0u = (y X) 0 (y X) = y fungsi dari : y + 0X0X 2 0X0 y, yang jelas-jelas a

(c).

@u0u 0
= 2X 0X 2X y=0
@
0
X 0X = X kamu

= (X 0X) 1X 0 kamu

(d)
b

= (X 0X) 1X 0 (X+ u)
= + (X 0X) 1X 0u
b

E = + (X 0X) 1X 0E(u)
b

E =

karena E(u) = 0 dan X adalah non-stochastic:

Soal 2 (a) b
b

Dalam Rt = t + ubt+ ; ubt adalah residual yang diestimasi, perbedaan antara nilai aktual
dan nilai prediksi Rt : memberikan proporsi variasi variabel dependen yang dijelaskan oleh
2 2
(b) R2 = 1 Pub t = P(Rt R) regresi, 29% dalam hal ini cukup rendah.

s = pPub 2 t=T 2 adalah ukuran kesalahan rata-rata, dalam hal ini 2,75 poin persentase,
kesalahan yang cukup besar dalam memprediksi tingkat bunga; DW = P ub 2 = Pub
2
t t adalah tes untuk korelasi serial, itu harus mendekati dua, jadi

pada 0,63 regresi ini menderita korelasi serial positif yang parah.

25
Machine Translated by Google

(c) adalah nilai yang akan diambil oleh suku bunga jika inflasi nol, suku bunga akan
menjadi 6,37%; adalah efek inflasi terhadap suku bunga: kenaikan inflasi sebesar 1 poin
persentase menaikkan suku bunga sebesar 0,33 poin persentase.
(d) Dalam model;
regresi harus eksogen, tidak berkorelasi dengan kesalahan, E( tut) = 0, regresi tidak boleh
bergantung linier, varians tidak sama dengan nol, dalam kasus regresi tunggal.t

Gangguan harus memiliki nilai


harapan (mean) nol, E(ut) = 0; tidak berkorelasi
serial, E(ututs) = 0; s 6= 0 dengan varians konstan,
2 2.
E (u )=
t

Soal 3 (a) t( =
0) = 6:37=0:66 = 9:65 tolak hipotesis yang sama dengan nol;
t(= 1) = (0:33 1)=0:10 = 6:7 tolak hipotesis yang sama dengan satu.
(b) Jika tingkat bunga riil konstan ditambah kesalahan acak (Hipotesis Fisher)
It = I + ut maka Rt = I + t + ut maka pada regresi = I dan = 1:
(c) Kesalahan tipe I menolak nol padahal itu benar, kesalahan Tipe II menerima
nol ketika itu salah. Probabilitas kesalahan tipe I pada (a) adalah 5%.
(d). Interval kepercayaan 95% adalah 0:33 2 0:10 yaitu rentang 0:13 hingga 0:53: Kami
yakin 95% bahwa rentang ini mencakup nilai sebenarnya dari :

Soal 4 (a)
Deáator adalah rasio NDY=RDY
Rasio NDY RDY 100 100
2000 654; 649 654; 649
2001 700; 538 685; 263 102:3
2002 721; 044 696; 224 (b) 103:6
Ináation, 2001-2: DY=1,27%,
RPI=1,67%; IHK=1,31; HP=16.92.
Booming harga rumah besar-besaran, RPI sedikit lebih tinggi dari CPI atau DY. (c).
Pengembalian riil adalah keuntungan modal atas harga rumah, dikurangi biaya bunga, dikurangi tingkat
inasi. Menggunakan CPI (lainnya dapat diterima)= 16,92-3,92-1,31=11,69%.
(d) Ya, bahkan jika Anda memiliki rumah sendiri dan telah melunasi hipotek Anda, ada
biaya sewa implisit kepemilikan rumah dan ini akan meningkat ketika harga rumah meningkat.

Pertanyaan 5.

26
Machine Translated by Google

(a) Komponen stokastik adalah ui itu adalah sedikit dari pendapatan log yang tidak dijelaskan
oleh regressor, akan mencerminkan kemampuan yang tidak terukur, dll.
(b) Kami mengharapkan pendapatan naik dan kemudian turun seiring bertambahnya usia, kuadrat
istilah menangkap fitur ini.
(c) Ya. Agar penghasilan naik dan turun seiring bertambahnya usia, kita perlu <1 0:>Anda
0 danmendapatkan
1
lebih banyak dengan pendidikan yang lebih baik jadi > 0: Koefisien positifpuncak
penghasilan pada istilah
nanti interaksi membuat
untuk pria yang lebih
2
berpendidikan tinggi, yang mungkin. (d) Untuk mendapatkan hasil yang maksimal
2

@w
= + 2 1A + 2E = 0
@SEBUAH
1
1
A = (2 1 ) ( 1 + 2E)
= 0:0746(6:6 + 4:1E)
= 0:49 + 0:31E

perhatikan Ai dan Ei dibagi 100.


Untuk Ei = 0 max w =100x0.49=49 tahun, .
Untuk Ei = 0:2 w=100x(0,49+0,31x0,2)=55 tahun.
Meskipun gagasan tentang seseorang dengan pendidikan nol tahun tidak mungkin, ini adalah nilai
yang masuk akal untuk usia produktif puncak.

Pertanyaan 6.
(a) Probabilitas bahwa variabel acak Z mengambil nilai lebih kecil dari nilai tertentu z.

(b)
(i) z=(1000-1005)/2=2,5. P(z<2,5)=1-P(z<2,5)=1-0,9938=0,0062=, 0,6%, kira-kira satu peluang dalam
200
(ii) z=(1004-1005)/2=0,5. P(-0,5<Z<0,5)=2x(0,6915-0,5)=0,383=38%. (c) (i) galat baku rata-
rata adalah 2= p 16 = 2=4 = 0:5; (ii) P(Z < 1004) : z=(1004-1005)/0.5=-2. P(z<-2)=1-
P(z<2)=1-0,9772=0,0228, 2,28%. (d) Dari c(ii) probabilitas mendapatkan nilai ini atau kurang adalah
2,28%, yang merupakan angka kecil, sehingga kemungkinan tidak bekerja dengan benar. Ini tidak
diperlukan untuk jawaban tetapi jika Anda ingin menguji pada tingkat 5% hipotesis nol bahwa itu
bekerja dengan benar ( = 1005), Anda perlu berhati-hati apakah alternatifnya adalah 6= 1005; dalam hal
ini akan ada 2,5% di setiap ekor; atau < 1005; di

27
Machine Translated by Google

dalam hal ini akan ada 5% di ekor bawah. Karena probabilitasnya kurang dari 2,5%, Anda akan
menolak baik pada uji dua sisi atau satu sisi. (e) Perkirakan varians sampel dari sampel Anda 16 s =
2
(161)1 P(xi untuk memeriksa apakah varians tampaknya telah meningkat dari 4. Ini bukan
x) 2;

diperlukan untuk jawabannya tetapi Anda akan menggunakan uji F rasio varians.

28
Machine Translated by Google

4. Melakukan Proyek Anda


Untuk melakukan proyek Anda, Anda perlu memilih topik dan mengumpulkan beberapa data;
melakukan beberapa analisis statistik (misalnya grafik, statistik ringkasan); menarik beberapa
kesimpulan dan menuliskan hasil Anda dengan jelas dalam gaya akademik standar dalam waktu kurang dari 3.000 kata.
Proyek ini akan dihitung 30% dari total nilai kursus dan harus diserahkan pada pertengahan Mei. Ini
untuk menguji kemampuan Anda mengumpulkan dan menginterpretasikan data, bukan menguji materi
yang tercakup dalam kursus ini, misalnya Anda tidak perlu melakukan regresi atau memberikan materi
buku teks tentang prosedur statistik.
Anda harus menyerahkan versi hard-copy dari proyek, dengan salinan elektronik dari data
(misalnya dalam CD). Kami tidak akan mengembalikan proyek Anda, yang kami simpan di le untuk
menulis referensi, dll. Buat salinan untuk Anda gunakan sendiri. Kami tidak menunjukkan proyek
kepada siapa pun kecuali penguji. Ini untuk memungkinkan siswa menggunakan data rahasia dari
pekerjaan.
Simpan salinan cadangan data dan draf teks Anda dengan aman saat Anda bekerja (komputer
perguruan tinggi adalah tempat yang aman). Kami sangat tidak simpatik jika Anda kehilangan pekerjaan
karena tidak didukung dengan benar. Jika Anda kehilangan pekerjaan, itu tidak didukung dengan benar.

4.1. ATURAN DASAR

Email proposal proyek proyek ke Ron Smith pada akhir minggu kedua bulan Maret. Proposal Anda
harus kurang dari 100 kata. Itu harus memiliki (1) nama Anda; (2) kursus Anda (3) judul indikatif (4)
deskripsi singkat tentang data yang akan Anda gunakan dan di mana Anda akan mendapatkannya
dan (5) indikasi singkat dari pertanyaan yang mungkin Anda selidiki. Anda harus memeriksa bahwa
data benar-benar tersedia, Anda tidak dapat melakukan proyek Anda tanpa data. Anda dapat mengubah
topik Anda selanjutnya jika mengalami kesulitan.

Kirimkan proyek Anda ke Kantor Departemen selambat-lambatnya pada pertengahan semester


ketiga. Mengacu pada peraturan Perguruan Tinggi tentang keterlambatan penyerahan pekerjaan.
Panjang: maksimum 3.000 kata (tidak termasuk grafik, tabel, lampiran, halaman judul dan abstrak,
tetapi termasuk yang lainnya). Jangan melebihi batas atas ini: bagian dari latihan ini adalah menuliskan
hasil Anda secara singkat.
Proyek Anda harus diketik, dijepit dengan aman, dan memiliki nomor halaman. Jangan
memasukkannya ke dalam binder atau folder. Anda harus melampirkan disket, CD, atau stik USB
dengan data Anda di dalam amplop berlabel nama dan mata kuliah Anda, dilampirkan dengan kuat
pada laporan Anda (misalnya dengan menstaples ke halaman terakhir). Data harus dalam bentuk yang
memungkinkan kami untuk mereplikasi apa yang telah Anda lakukan, misalnya dalam file dari program standar.

29
Machine Translated by Google

Halaman pertama harus berupa halaman judul dengan informasi berikut:

Judul kursus dan tahun (misalnya Proyek ASE GDE 2010)

Judul proyek

Namamu

Abstrak: panjang maksimal 100 kata

Jumlah kata dalam proyek

Program yang Anda gunakan

Anda harus membuat grafik data (grafik garis, histogram, atau diagram pencar)
Semua grafik dan tabel harus memiliki judul dan diberi nomor Anda
harus memiliki daftar pustaka Anda harus merinci sumber data Anda
dan menyediakannya.
Proyek harus merupakan karya Anda sendiri. Anda dapat mendiskusikannya dengan teman atau
kolega dan merupakan ide yang baik bagi siswa untuk membaca dan mengomentari pekerjaan satu
sama lain tetapi itu harus menjadi pekerjaan Anda yang Anda kirimkan. Plagiarisme adalah pelanggaran
serius (lihat bagian dalam buku pegangan kursus).

4.2. BAGAIMANA KAMI AKAN MENILAI PEKERJAAN ANDA

Kriteria tercantum di bawah ini. Kami tidak menetapkan bobot tetap untuk mereka, Anda dapat
menukarnya, tetapi waspadai pengembalian yang semakin berkurang.
Menulis. Anda tidak akan mendapatkan kredit apa pun kecuali kami dapat memahami apa yang
telah Anda lakukan. Kami mencari organisasi yang jelas dari potongan secara keseluruhan; penulisan
yang jelas dalam paragraf dan kalimat terpisah; argumen logis dan penggunaan bukti yang cermat.
Periksa ejaan dan tata bahasa Anda. Kami telah menetapkan batas kata pendek jadi buat setiap kata
berarti.
Konvensi ilmiah. Apakah sumber ide dan kutipan diketahui dengan benar. Apakah ada daftar
referensi? Apakah sumber data didokumentasikan dengan benar?
Apakah proyek ditulis dalam gaya akademis (sebagai lawan, katakanlah, jurnalistik)? Jika Anda
melakukannya pada topik yang berkaitan dengan pekerjaan Anda, ingatlah gayanya mungkin harus
berbeda dari yang sesuai di tempat kerja. Salin gaya artikel di jurnal ekonomi.

Orisinalitas/minat. Sebagian besar topik dapat dibuat menarik jika disajikan dengan cukup baik,
tetapi lebih sulit untuk menemukan sesuatu yang menarik untuk dikatakan tentang suatu standar.

30
Machine Translated by Google

topik, seperti CAPM atau fungsi konsumsi agregat, daripada tentang topik yang sedikit lebih tidak
biasa. Kami bosan membaca lebih dari 100 proyek, coba buat proyek Anda berkesan.

Analisis. Apakah pekerjaan Anda menunjukkan pemahaman yang baik tentang konteks yang
relevan, misalnya ekonomi, institusi? Sudahkah Anda membawa konsep yang sesuai, misalnya teori
ekonomi atau keuangan, untuk menunjang pekerjaan Anda? Dapatkah Anda mengembangkan
argumen logis dan menggunakan bukti secara efektif untuk mendukung argumen Anda? Apakah
Anda menjawab pertanyaan yang Anda ajukan? Apakah Anda jelas tentang arah kausalitas?
Pengumpulan/keterbatasan data. Sudahkah Anda mengumpulkan data yang sesuai (mengingat
keterbatasan waktu)? Sudahkah Anda berhati-hati untuk memeriksa data mentah dan variabel
turunan? Apakah Anda memahami apa yang sebenarnya diukur oleh data Anda? Apakah Anda
menyadari keterbatasan data Anda? Anda akan menerima beberapa kredit untuk jumlah pekerjaan
yang tidak biasa yang telah Anda lakukan untuk mengumpulkan data. Kecuali Anda memiliki
pengalaman dalam merancang survei, jangan melakukan survei untuk mengumpulkan data.
Ringkasan data dan presentasi. Sudahkah Anda menghitung variabel turunan yang sesuai?
Pernahkah Anda memperhatikan pengamatan yang tampaknya tidak wajar? Apakah Anda
menunjukkan kemampuan untuk meringkas dan menyajikan data dengan cara yang jelas dan efektif?

Metode Statistik. Sudahkah Anda menggunakan metode statistik yang tepat? Gunakan teknik
paling sederhana yang akan menjawab pertanyaan Anda. Apakah Anda memenuhi syarat untuk
kesimpulan yang telah Anda buat? misalnya menunjukkan bahwa ukuran sampel kecil atau bahwa
Anda tidak dapat mengontrol faktor-faktor tertentu, dll. Waspadalah terhadap penggunaan teknik
statistik tingkat lanjut yang tidak Anda pahami; Anda akan dihukum untuk setiap kesalahan yang
Anda buat dalam penggunaannya.
Penafsiran. Seberapa baik Anda menafsirkan data Anda? Sudahkah Anda mengingat
keterbatasannya saat menafsirkannya? Apakah interpretasi Anda mengungkapkan pemahaman
tentang konsep yang relevan?

4.3. MEMILIH TOPIK

Anda dapat melakukan proyek Anda pada apa pun yang melibatkan interpretasi data, tidak harus
secara ekonomi atau keuangan secara sempit. Topiknya mungkin berasal dari pekerjaan Anda,
masalah yang muncul dalam kursus, item dalam berita, atau apa pun yang menarik minat Anda.
Seringkali pilihan topik didorong oleh data yang tersedia.

31
Machine Translated by Google

4.4. DATA

Barrow Ch. 9 membahas data. Anda harus memberi kami salinan data yang telah Anda
gunakan. Jika Anda perlu menggunakan data rahasia terkait pekerjaan, kami dapat
memberikan surat kepada atasan Anda yang menjelaskan bahwa data tersebut akan
dirahasiakan. Anda harus memilih topik di mana Anda dapat menemukan data tanpa terlalu
banyak usaha. Jika Anda tidak dapat membuat kemajuan substansial dalam menemukan
data dalam 2-3 jam pencarian sistematis, baik di perpustakaan atau melalui internet, Anda
mungkin harus mengubah topik Anda. Ada sejumlah besar statistik yang tersedia di Web
dari pemerintah, bank sentral, organisasi internasional (IMF, OECD atau Bank Dunia). Juga
periksa Birkbeck eLibrary, database statistik; aliran data tersedia di perpustakaan. Sumber
utama Inggris adalah Kantor Statistik Nasional, Data AS tersedia di Database Ekonomi
Federal Reserve dan Biro Analisis Ekonomi. Coba Google atau mesin pencari lainnya:
cukup ketik topik yang Anda minati dan kemudian data, misalnya Data Kematian Lalu Lintas
Jalan dapatkan berbagai situs dengan data internasional tentang kematian lalu lintas jalan.

Periksa data Anda, dari mana pun asalnya. Kesalahan (misalnya titik desimal di tempat
yang salah) dapat menyebabkan kekacauan jika Anda melewatkannya. Periksa satuan,
diskontinuitas, dan perubahan definisi deret (misalnya penyatuan Jerman). Periksa variabel
turunan serta data mentah. Menghitung minimum, maksimum, dan rata-rata dapat membantu
menemukan kesalahan. Lakukan pemeriksaan lagi jika Anda memindahkan data dari satu
jenis le ke jenis lainnya.

4.5. SEPERTI APA LAPORAN ANDA HARUS TERLIHAT?

Laporan proyek Anda harus menceritakan sebuah cerita, dengan awal, tengah dan akhir. Ini
adalah cerita tentang penyelidikan Anda bukan bagian dari otobiografi Anda. Struktur berikut
adalah saran, sesuaikan dengan pertanyaan Anda. Lihat struktur yang digunakan di bagian
7.7, yang menjelaskan pertumbuhan dan ináasi Inggris.

4.5.1. ABSTRAK

Di sini Anda harus meringkas proyek Anda dalam 100 kata atau kurang. Banyak jurnal
mencetak abstrak di awal setiap makalah, salin formulirnya

4.5.2. PENGANTAR.

Jelaskan apa yang akan Anda selidiki, pertanyaan yang akan Anda jawab, dan mengapa itu
menarik. Katakan secara singkat jenis data apa yang akan Anda gunakan (mis.

32
Machine Translated by Google

seri waktu Inggris triwulanan 1956-2009 di bagian 7.7). Selesaikan bagian ini dengan
sebuah paragraf yang menjelaskan organisasi dari sisa laporan Anda.

4.5.3. LATAR BELAKANG

Bagian ini memberikan konteks untuk analisis selanjutnya, membahas literatur yang
relevan, teori atau latar belakang lainnya, misalnya penjelasan istilah spesialis. Jangan
memberikan materi buku teks standar; Anda harus memberi tahu kami tentang apa yang
tidak kami ketahui, bukan apa yang kami ketahui. Pada beberapa topik ada banyak literatur
tentang yang lain akan sangat sedikit. Katalog perpustakaan, database EconLit, dan staf
perpustakaan dapat membantu Anda menemukan literatur.
Dalam banyak kasus, bagian ini akan menjelaskan fitur pasar atau industri yang Anda
analisis. Khususnya, jika Anda menulis tentang industri tempat Anda bekerja, Anda harus
memastikan bahwa Anda menjelaskan fitur industri, atau istilah teknis yang digunakan di
dalamnya, yang mungkin sangat dikenal oleh semua orang di dalamnya, tetapi tidak bagi
orang luar.

4.5.4. DATA

Di sini Anda harus bertujuan untuk memberikan informasi yang cukup kepada pembaca
untuk mengikuti sisa laporan, tanpa menahan alur cerita. Rincian dapat diberikan dalam
lampiran. Anda harus mendiskusikan keanehan data, atau kesulitan pengukuran. Anda
mungkin perlu mendiskusikan perubahan definisi variabel dari waktu ke waktu.

4.5.5. ANALISIS

Latar belakang harus memandu Anda dalam menyarankan fitur data untuk dilihat, hipotesis
untuk diuji, pertanyaan untuk diajukan. Anda harus memiliki tabel dan grafik yang
menjelaskan fitur data secara luas. Dalam kasus data deret waktu, fitur-fitur ini mungkin
mencakup tren, siklus, pola musiman, dan pergeseran rata-rata atau varians deret tersebut.
Dalam kasus data penampang, mereka mungkin termasuk tabel rata-rata dan standar
deviasi, histogram atau tabulasi silang. Dalam menafsirkan data, berhati-hatilah untuk tidak
menarik kesimpulan di luar yang dijamin olehnya. Seringkali kesimpulan yang dapat Anda
tarik akan lebih tentatif daripada yang Anda inginkan; keterbatasan data saja dapat
memastikan hal ini. Jangan biarkan respons emosional atau etis Anda mengaburkan
interpretasi Anda tentang apa yang Anda temukan dalam data.

33
Machine Translated by Google

Jika Anda menjalankan regresi, laporkan: nama variabel (termasuk variabel dependen);
jumlah pengamatan dan definisi sampel; koefisien dan rasio-t, kesalahan standar atau nilai p; R-
kuadrat (atau R-bar-kuadrat); kesalahan standar regresi; dan statistik uji lain yang sesuai seperti
Durbin-Watson untuk deret waktu.

4.5.6. RINGKASAN DAN KESIMPULAN.

Apa temuan utama dari pekerjaan Anda, jawaban atas pertanyaan yang Anda ajukan dalam
pendahuluan? Bagaimana temuan Anda harus dikualifikasikan karena keterbatasan data atau
metode analisis yang Anda gunakan? Apakah mereka memiliki implikasi kebijakan (publik atau
swasta)? Apakah Anda memiliki saran untuk pekerjaan lebih lanjut?

4.5.7. BIBLIOGRAFI

Anda harus memberikan kutipan bibliografi untuk setiap karya yang dirujuk dalam teks, mengikuti
sistem Harvard, yang digunakan di bagian 1.5.

4.5.8. LAMPIRAN

Anda harus memiliki lampiran data, memberikan definisi variabel yang tepat, dan detail
sumbernya. Prinsip panduannya adalah Anda harus memberikan detail yang cukup untuk
memungkinkan pembaca mereproduksi data Anda. Berikan data dalam bentuk elektronik yang
dilampirkan pada proyek.

4.6. Semoga beruntung

Anda dapat belajar banyak dengan mengerjakan proyek Anda. Keterampilan yang dapat Anda
kembangkan dalam analisis, interpretasi, dan presentasi data sangat berharga di pasar tenaga kerja;
dan memiliki proyek untuk menunjukkan kepada calon pemberi kerja dapat berguna dalam mendapatkan pekerjaan.
Melakukan proyek Anda juga bisa menjadi pengalaman yang sangat menyenangkan. Semakin Anda berhati-hati
dengannya, semakin banyak Anda akan belajar, dan semakin banyak kesenangan yang akan Anda dapatkan.

34
Machine Translated by Google

5. BAGIAN II: CATATAN


Kata Statistik setidaknya memiliki tiga arti. Pertama, data itu sendiri, misalnya angka-angka
yang dikumpulkan oleh BPS. Kedua, memiliki arti teknis sebagai ukuran yang dihitung dari data,
misalnya rata-rata. Ketiga, adalah subjek akademis yang mempelajari bagaimana kita membuat
kesimpulan dari data.
Statistik deskriptif memberikan ringkasan informatif (misalnya rata-rata) atau presentasi
(misalnya grafik) dari data. Kami akan mempertimbangkan jenis statistik ini terlebih dahulu.
Apakah ringkasan data tertentu berguna atau tidak tergantung pada apa yang Anda inginkan.
Anda harus menilai kualitas rangkuman berdasarkan tujuan penggunaannya, rangkuman yang
berbeda berguna untuk tujuan yang berbeda.
Inferensi statistik dimulai dari model probabilitas eksplisit tentang bagaimana data dihasilkan.
Misalnya, kurva permintaan empiris mengatakan kuantitas yang diminta tergantung pada
pendapatan, harga dan faktor acak, yang kami modelkan menggunakan teori probabilitas. Model
tersebut seringkali melibatkan beberapa parameter yang tidak diketahui, seperti elastisitas harga
dari permintaan suatu produk. Kami kemudian bertanya bagaimana mendapatkan perkiraan
parameter yang tidak diketahui ini dari sampel pengamatan pada harga yang dikenakan dan
kuantitas yang terjual dari produk ini. Biasanya ada banyak cara yang berbeda untuk
memperkirakan parameter dan dengan demikian banyak estimator yang berbeda: aturan untuk
menghitung perkiraan dari data. Beberapa cara akan cenderung memberikan perkiraan yang
baik dan beberapa yang buruk, jadi kita perlu mempelajari sifat-sifat estimator yang berbeda.
Apakah penduga tertentu baik atau buruk tergantung pada tujuannya.
Misalnya, ada tiga ukuran umum (penaksir) dari nilai tipikal (kecenderungan sentral) dari
satu set pengamatan: mean aritmatika atau rata-rata; median, nilai yang setengah dari
pengamatan terletak di atas dan setengah di bawah; dan modus, nilai yang paling sering
muncul. Ini mengukur aspek yang berbeda dari distribusi dan berguna untuk tujuan yang
berbeda. Untuk banyak ukuran ekonomi, seperti pendapatan, ukuran ini bisa sangat berbeda.
Hati-hati dengan rata-rata. Jika kita memiliki kelompok 100 orang, salah satunya telah diamputasi
kaki, rata-rata jumlah kaki adalah 1,99. Jadi 99 dari 100 orang memiliki jumlah kaki di atas rata-
rata. Perhatikan, dalam hal ini median dan jumlah modal kaki adalah dua.

Kita sering ingin mengetahui seberapa tersebar data tersebut, sejauh mana ia dapat berbeda
dari nilai tipikal. Ukuran sederhana adalah rentang, perbedaan antara nilai maksimum dan
minimum, tetapi ini sangat sensitif terhadap nilai ekstrem dan kami akan mempertimbangkan
tindakan lain di bawah ini.
Kadang-kadang kita tertarik pada satu variabel, misalnya tinggi badan, dan mempertimbangkan rata-ratanya
dalam suatu kelompok dan bagaimana variabel itu bervariasi dalam kelompok tersebut? Ini adalah statistik univariat,

35
Machine Translated by Google

hubungannya dengan satu variabel. Terkadang, kami tertarik pada hubungan antar variabel:
bagaimana berat badan bervariasi dengan tinggi badan? atau bagaimana kuantitas
bervariasi dengan harga? Ini adalah statistik multivariat, lebih dari satu variabel terlibat dan
model hubungan yang paling umum antara variabel adalah korelasi dan regresi, yang
dibahas di bawah ini.
Model adalah representasi realitas yang disederhanakan. Ini mungkin model fisik,
seperti model pesawat terbang. Di bidang ekonomi, model fisik yang terkenal adalah Mesin
Phillips, sekarang di Museum Sains, yang mewakili aliran pendapatan nasional melalui air
yang mengalir melalui pipa transparan. Sebagian besar model ekonomi hanyalah kumpulan
persamaan. Ada banyak model yang mungkin dan kami menggunakan teori (diinterpretasikan
secara luas untuk memasukkan informasi institusional dan historis) dan metode statistik
untuk membantu kami memilih model terbaik dari data yang tersedia untuk tujuan khusus kami.
Teori juga membantu kita menginterpretasikan perkiraan atau ringkasan statistik lain yang
kita hitung.
Melakukan ekonomi atau keuangan kuantitatif terapan, biasanya disebut ekonometrika,
dengan demikian melibatkan sintesis dari berbagai elemen. Kita harus jelas tentang
mengapa kita melakukannya: tujuan dari latihan. Kita harus memahami karakteristik data
dan menghargai kelemahannya. Kita harus menggunakan teori untuk menyediakan model
proses yang mungkin menghasilkan data. Kita harus mengetahui metode statistik yang
dapat digunakan untuk meringkas data, misalnya dalam perkiraan. Kita harus bisa
menggunakan perangkat lunak komputer yang membantu kita menghitung rangkuman. Kita
harus mampu menginterpretasikan ringkasan sesuai dengan tujuan awal dan teori kita.

5.1. Contoh: tujuan senjata AA

Buku kecil itu memuat banyak contoh, beberapa di antaranya bukan dari ekonomi atau
keuangan, karena persoalannya seringkali lebih sederhana di daerah lain. Contoh ini
adalah untuk menggambarkan pentingnya menafsirkan ringkasan statistik dalam hal tujuan.
Pada awal Perang Dunia II, Inggris memasang beberapa kapal dagang dengan senjata
antipesawat (AA). Analisis statistik berikutnya menunjukkan bahwa tidak ada pesawat
Jerman yang pernah terkena senjata AA pedagang dan diputuskan untuk memindahkannya.
Namun, sebelum ini dilakukan, analisis statistik lain menunjukkan bahwa hampir tidak ada
kapal yang dilengkapi AA yang terkena bom dari pesawat Jerman, sedangkan sejumlah
besar kapal tanpa AA terkena bom. Ini adalah statistik yang relevan dan senjata AA
disimpan di kapal dagang. Meskipun senjata tidak mengenai pengebom, tetapi mereka
menjauhkan pengebom dari

36
Machine Translated by Google

kapal, mengurangi kemungkinan mereka merusak kapal. Contoh lain dari penggunaan
statistik semacam ini dalam Perang Dunia II dapat ditemukan di The Pleasures of Counting,
TW Korner, Cambridge University Press, 1996.

5.2. Contoh: model Pasar Efisien.

Model sederhana dan sangat kuat dalam ekonomi dan keuangan adalah jalan acak

yt = yt1 + "t :

Ini mengatakan bahwa nilai yang dibutuhkan variabel hari ini, waktu t; adalah nilai yang
dimilikinya kemarin, wakturata-rata
t 1; ditambah
nol dan kejutan
tidak dapat
acak,
diprediksi
"t . Guncangan
sebelumnya.
bisa positif
Guncangan
atau negatif,
seperti itu sering disebut 'White noise'. Untuk perkiraan pertama, ini adalah deskripsi yang
sangat baik tentang logaritma banyak aset harga seperti harga pasar saham dan nilai tukar
mata uang asing, karena pasar cukup efisien: perubahan harga log (tingkat pertumbuhan) yt
= yt yt1 = "t acak, tidak dapat diprediksi. Misalkan orang mengetahui sesuatu yang akan
menaikkan harga saham besok, mereka akan membeli hari ini dan itu akan menaikkan harga
saham hari ini. Setiap informasi tentang masa depan yang dapat diprediksi akan tercermin
dalam harga saham sekarang. Jadi perkiraan terbaik Anda dari harga besok adalah harga
hari ini. Apa yang akan menggerakkan harga saham akan menjadi informasi baru yang tidak
dapat diprediksi. Kejutan atau kesalahan acak "t mewakili informasi tak terduga yang
mengubah harga. Sebagian besar model kami akan melibatkan kejutan acak seperti "t :
Terkadang sebuah perusahaan akan melaporkan kerugian besar dan harga sahamnya akan
naik. Ini karena pasar telah memperkirakan kerugian yang lebih buruk, yang telah tercermin
dalam harga. Ketika kerugian yang dilaporkan tidak seburuk yang diharapkan harga naik.
Apakah hipotesis pasar yang efisien benar-benar benar adalah subyek kontroversi, tetapi ini
adalah pendekatan pertama yang mencerahkan.

Jika variabel memiliki tren, ini dapat diizinkan untuk berjalan secara acak dengan drift

yt = + yt1 + "t :

Kemudian variabel tersebut meningkat rata-rata setiap periodenya. Jika variabelnya adalah
logaritma, adalah tingkat pertumbuhan rata-rata. Ini adalah parameter model, yang akan kami
perkirakan dari data yt : Parameter seperti dan kesalahan acak atau guncangan seperti "t
akan memainkan peran besar dalam analisis kami.

37
Machine Translated by Google

5.3. Notasi

Sangat mudah untuk mengekspresikan model dalam notasi matematika, tetapi notasi tidak
konsisten antara buku dan simbol yang sama berarti hal yang berbeda dalam disiplin ilmu yang
berbeda. Misalnya, Y sering menunjukkan variabel dependen tetapi karena itu adalah simbol
ekonomi standar untuk pendapatan, itu sering muncul sebagai variabel independen. Adalah
umum untuk menggunakan huruf kecil untuk menunjukkan penyimpangan dari mean, tetapi
juga umum untuk menggunakan huruf kecil untuk menunjukkan logaritma.
Jadi yt dapat menunjukkan Yt Y atau dapat menunjukkan ln(Yt): Logaritma dapat ditulis ln(Yt)
atau log(Yt); tetapi dalam pekerjaan empiris logaritma natural, ke basis e, hampir selalu
digunakan. Jumlah pengamatan dalam sampel kadang-kadang dilambangkan T untuk deret
waktu dan kadang-kadang N atau n untuk penampang.
Dalam statistik kita sering berasumsi bahwa ada beberapa parameter benar yang tidak
teramati dan ingin menggunakan data untuk mendapatkan perkiraannya. Jadi kita perlu
membedakan parameter sebenarnya dari estimasi. Ini biasanya dilakukan dengan dua cara.
Parameter sebenarnya, katakanlah simpangan baku, dilambangkan dengan huruf Yunani,
b

katakanlah ; dan perkiraan dilambangkan dengan meletakkan topi di atasnya,


hatíor dengan
; kata sigma
menggunakan padanan huruf latin, s. Dalam banyak kasus, kita memiliki lebih dari satu
estimator yang mungkin (rumus untuk menghasilkan estimasi dari sampel) dan kita harus
membedakannya. Ini adalah kasus dengan standar deviasi, ada dua formula untuk
b

menghitungnya, dilambangkan dalam catatan ini dengan dan s. Namun,


tentang simbol
buku tidak
manakonsisten
yang
mereka gunakan untuk formula apa, jadi Anda harus berhati-hati.

Alfabet Yunani banyak digunakan. Diberikan di bawah ini, dengan huruf besar, huruf kecil,
nama dan contoh.
Sebuah alfa; sering digunakan untuk intersep dalam regresi.
B beta; sering digunakan untuk koefisien regresi dan ukuran risiko saham dalam keuangan.

gamma.
delta; digunakan untuk perubahan, yt = yt yt1; sering tingkat depresiasi.
E atau " epsilon; " sering error istilah.
Z zeta.
dia; sering elastisitas. theta;
terkadang ruang parameter; sering menjadi parameter umum.
saya sedikit.

K kappa.
lambda; seringkali merupakan kecepatan penyesuaian.
saya; sering menunjukkan nilai atau rata-rata yang diharapkan.

38
Machine Translated by Google

N nu.
xi.
Oo mikron.
pi; (rasio keliling dengan diameter) sering digunakan untuk ináasi. adalah

simbol hasil kali: Yyi = y1 y2 ::: yn .


P rho; sering menunjukkan koefisien autokorelasi.
2
sigma; biasanya varians, standar deviasi, adalah penjumlahan
operator, juga kadang-kadang digunakan untuk matriks kovarians varians.
T tau.
upsilon.
' phi; (y) terkadang fungsi distribusi normal; (y) kerapatan normal
fungsi.
2
Xchi; psi. distribusi.

! akhir; sering merupakan matriks kovarians varians.

39
Machine Translated by Google

6. Statistik deskriptif
Data cenderung datang dalam tiga bentuk utama:
-deret waktu, misalnya pengamatan tentang inflasi tahunan di Inggris selama beberapa

bertahun-tahun; -cross-section, misalnya pengamatan inflasi tahunan di berbagai negara di a


tahun tertentu; dan
-panels misalnya observasi ináation di sejumlah negara di sejumlah
bertahun-tahun.

Data deret waktu memiliki keteraturan alami, 1998 muncul setelah 1997; data penampang tidak
memiliki keteraturan alami; negara dapat diurutkan berdasarkan abjad, berdasarkan ukuran atau cara
lainnya.
Data biasanya diwakili oleh huruf subscript. Jadi data deret waktu pada ináation dapat
dilambangkan yt , T: Ini menunjukkan kita(misalnya
memiliki barisan
1997)
berjalan
sehingga
t = 1;dari
2; :::;
jumlah
t =pengamatan
1 (misalnya
pengamatan
pada
1961)
Tináation
=ke37.
t =Untuk
T
satu set negara, kita mungkin menunjukkan ini N. Dimana, jika mereka disusun menurut abjad, i = 1
mungkin oleh yi , i = 1; 2; :::; sesuai dengan Albania dan i = N ke Zambia. Data panel akan
mengatakan
total.Inggris,
Kami akan
pada
dilambangkan
menggunakan
tahun tertentu,
yit;kedua
dengan
t; katakanlah
T dan
pengamatan
N 1995,
untuk ini
menunjukkan
khas
memberikan
pada ináasi
jumlah
pengamatan
di negara
pengamatan
tertentu
TN secara
dalam
i;
sampel.

Grafik umumnya merupakan cara terbaik untuk menggambarkan data. Ada tiga jenis grafik yang
biasa digunakan ekonom. Pertama, untuk data deret waktu, kami menggunakan grafik garis, memplot
deret tersebut terhadap waktu. Kami kemudian dapat mencari tren (kecenderungan umum untuk naik
atau turun); pola musiman atau siklus yang teratur; outlier (peristiwa yang tidak biasa seperti perang
atau krisis). Kedua, kita dapat memplot histogram, yang memberikan jumlah (atau proporsi) pengamatan
yang berada dalam rentang tertentu. Ketiga kita dapat memplot satu variabel terhadap variabel lain
untuk melihat apakah mereka terkait, ini adalah diagram pencar atau Plot XY. Barrow Bab 1 memiliki
banyak contoh.

6.1. Ringkasan Statistik

Kami akan menggunakan aljabar, khususnya operator penjumlahan, untuk menggambarkan


operasi pada data. Rumusnya mungkin terlihat rumit, tetapi itu hanyalah sekumpulan
instruksi. Misalkan kita memiliki serangkaian angka: 2,4,6,8, yang kita nyatakan, x1; x2; x3; x4;

40
Machine Translated by Google

xi ; saya = 1; 2; :::; N, di mana N = 4: Jumlahnya adalah 20; yang kami tunjukkan

X xi = 2 + 4 + 6 + 8 = 20
saya = 1

ini hanya mengatakan menambahkan elemen N dari x. Jika kita mengalikan setiap angka dengan
konstanta dan menambahkan konstanta ke setiap angka untuk membuat yi = a + bxi , kemudian

N N N

X yi = X (a + bxi) = N a + b X xi :
saya = 1 saya = 1 saya = 1

Pada contoh di atas untuk a = 1; b = 2, maka yi = 5; 9; 13; 17, dengan jumlah 44, yang
sama dengan 4 1 + 2 20.

6.1.1. Mean, ukuran tendensi sentral atau nilai tipikal

Rata-rata aritmatika (rata-rata) dari xi ; biasanya dilambangkan dengan bar di atas variabel,
kata x barí, didefinisikan sebagai
N

x = X xi=N:
saya = 1

Dalam contoh ini, itu adalah 20/4=5. Rumusnya hanya mengatakan jumlahkan semua
nilai dan bagi dengan jumlah pengamatan. Ada jenis lain yang berarti. Misalnya, rata-rata
geometrik adalah akar ke-N dari hasil kali bilangan-bilangan tersebut

GM(x) = pN x1 x2 ::: xN

dan dapat dihitung sebagai eksponensial (anti-log) dari rata-rata aritmatika dari logaritma
angka, lihat Barrow P54.

6.1.2. Varians dan standar deviasi, ukuran dispersi


2
sering dilambangkan ance, ) mengukur ; danseberapa
standar deviasi
tersebar
(akar
ataukuadrat
menyebar
dari pengamatan.
vari Varians,
Varians lebih cocok untuk derivasi matematika, tetapi dalam pekerjaan terapan selalu
menggunakan standar deviasi. Standar deviasi dalam satuan yang sama dengan variabel
awal. Jika suatu variabel terdistribusi normal, dua pertiga pengamatan akan berada dalam
kisaran mean plus dan minus satu standar deviasi dan 95%

41
Machine Translated by Google

pengamatan akan terletak pada kisaran rata-rata plus atau minus dua standar
penyimpangan.

Salah satu penduga varian dari xi , (kadang-kadang disebut varians populasi)


adalah

N
b2 2
=X ( xx) = N:
saya = 1

b2
Perhatikan di sini kita membedakan antara nilai sebenarnya dan2 perkiraan kita. Rumus ini :

memberikan satu set instruksi. Dikatakan ambil setiap pengamatan dan


2 2
kurangi mean, (xix); kuadratkan (xix) ; jumlahkan semuanya PN i=1(xix)
dan bagi dengan jumlah pengamatan, 4 dalam hal ini: PN i=1(xix) 2=N =
20=4 = 5:
2
saya
xi xi x (xi x)
3 9
12 24 1 1
6 1
34 8 13 9
jumlah 20 0 20
Dalam hal ini baik Mean dan Varians adalah 5. Standar deviasi,
b

SD(x) = adalah akar kuadrat dari varians: 2,24 dalam kasus ini.
Penaksir lain dari varians xi , (kadang-kadang disebut varians sampel)
adalah

N
2
2
detik
=X ( xx) =(N 1):
saya = 1

b2 2 di bawah.
Kami membahas perbedaan antara dan S

6.1.3. Kovarians dan korelasi, ukuran asosiasi

Kovarians yang digunakan untuk mengukur hubungan antar variabel adalah

Cov(x; y) = X (xi x) (yi y) =N:


saya = 1

Kovarians akan positif jika nilai x tinggi dikaitkan dengan nilai tinggi
dari y; negatif jika nilai x yang tinggi dikaitkan dengan nilai y yang rendah: Ini akan menjadi nol
apakah tidak ada hubungan linier antar variabel. Kovarians dapat berupa
sulit untuk ditafsirkan, sehingga sering dibakukan untuk memberikan koefisien korelasi,

42
Machine Translated by Google

dengan membagi kovarians dengan produk dari standar deviasi dari dua variabel.

Cov(x; y)
r=
SD(x)SD(y)
Koefisien korelasi terletak antara plus dan minus satu, 1 r 1: Koefisien korelasi 1 berarti
ada hubungan linier negatif eksak antara variabel, +1 hubungan linier pasti positif, dan 0 tidak
ada hubungan linier . Korelasi tidak berarti sebab-akibat. Dua variabel mungkin berkorelasi
karena keduanya disebabkan oleh variabel ketiga.

6.1.4. Data terstandarisasi

Data sering distandarisasi dengan mengurangkan mean dan membaginya dengan standar
deviasi (akar kuadrat dari varians sampel),

xi x
zi = :

Variabel baru ini, zi; memiliki mean nol dan varians (dan standar deviasi) satu. Perhatikan
koefisien korelasi adalah kovarians antara ukuran standar x dan y:

6.1.5. Momen

Sebuah distribusi sering digambarkan dengan:

momen-momennya, yaitu PN i=1xi r=N. Rata-rata x = Pxi=N adalah momen pertama, r


= 1.
2
momen pusatnya PN i=1(xi x) r=N: Varians, = PN i=1(xi x) 2=N adalah momen pusat
kedua, r = 2: Momen berpusat pertama, PN i=1( xi x)=N = 0.

momen standarnya Pz r =N; di manazi = (xi x)=s: Momen standar ketiga, r = 3; adalah
saya

ukuran apakah distribusinya simetris atau miring. Momen standar keempat, r = 4;


adalah ukuran kurtosis (seberapa gemuk ekor distribusinya). Untuk distribusi normal,
koefisien skewness Pz kurtosis Pz
3

saya =N adalah nol, dan koefisien dari


4
saya = N adalah 3.

43
Machine Translated by Google

Beberapa distribusi tidak memiliki momen. Rata-rata (rata-rata) waktu untuk mendapatkan gelar PhD
tidak ditentukan karena beberapa siswa tidak pernah menyelesaikan, meskipun median ditentukan, waktu
yang dibutuhkan 50% untuk menyelesaikan.

6.2. Contoh, rata-rata dan pembalikan

Misalkan sebuah perusahaan memiliki dua pabrik satu di utara dengan upah rendah, di mana ia
mempekerjakan sebagian besar staf laki-laki, dan yang lainnya di selatan dengan upah tinggi, di mana
ia mempekerjakan sebagian besar perempuan. Dalam keduanya membayar laki-laki lebih dari
perempuan. Tabel di bawah ini memberikan jumlah staf laki-laki, NM; upah laki-laki, WM; jumlah
perempuan, NF dan upah perempuan WF:
NM WM NF WF
N 200 350 50 300
S 50 500 200 450
Upah rata-rata laki-laki adalah (200 350+50 500)=(200+50) = 380: Upah rata-rata perempuan
adalah (50 300 + 200 450)=(50 + 200) = 420: Meskipun membayar laki-laki lebih banyak
daripada perempuan pada keduanya pabrik, upah rata-rata perempuan lebih tinggi dari upah
rata-rata laki-laki, karena mempekerjakan lebih banyak perempuan di selatan upah tinggi.
Pembalikan ini dikenal sebagai paradoks Simpson, meskipun dia bukan orang pertama yang mencatatnya.

6.3. Contoh, Apakah Ekonom setuju?

Dikatakan bahwa ketika Anda mengumpulkan dua ekonom, Anda akan mendapatkan tiga
pendapat; karena seseorang akan mengatakan ..., di
2004,
satuBBC
sisi dimensponsori
sisi lain ...,í. survei
Pada bulan
pandangan
Juni
Society of Business Economist (www.sbe.co.uk) tentang tren harga rumah di Inggris
selama tiga tahun ke depan. 225 anggota menjawab. Mereka harus memilih dari berbagai
rentang, sehingga mereka tidak bisa mengatakan 'di satu sisi mereka mungkin naik, tetapi
di sisi lain mereka mungkin turun'. untuk pertumbuhan yang diharapkan di rumah
Persentase f(xi) memilih setiap rentang, harga xi ;

adalah
xi > 15% f(xi)
15%
5 15% 25% 0
5% 18% 10 0%
24% < 10% 18%

Ada dua mode: kira-kira seperempat harga akan naik antara 5 dan 15% dan seperempat
harga akan turun hingga 10%. Median (setengah di atas

44
Machine Translated by Google

dan setengah di bawah) jatuh dalam kisaran 0 hingga 5%. Distribusinya simetris secara luas.
Untuk menghitung rata-rata dan varians, kita perlu menetapkan nilai ke rentang, yang:
pasti sewenang-wenang sampai batas tertentu. Kami akan menggunakan titik tengah dari rentang tertutup,
misalnya titik tengah 5-15% adalah 10%; dan untuk rentang terbuka memperlakukan lebih dari 15%
sebagai 20%, dan kurang dari -10% sebagai -15%. Ini memberikan nilai Xi di bawah ini. Kami juga memberikan
pi proporsi di setiap rentang, persentase dibagi 100.
Kami tidak dapat menggunakan rumus standar kami untuk mean, jadi kami perlu menyesuaikannya. Melihat
Gerobak p27. Panggil jumlah total responden, N = 225: Panggil nomor siapa
menjawab di setiap rentang Ni : Jadi nomor di rentang terendah (siapa yang menjawab
bahwa mereka akan turun lebih dari 10%), N1 = 0:18 225 = 40:5: Persentase
dibulatkan, itulah sebabnya itu bukan bilangan bulat. Kita bisa menghitung rata-rata dengan
mengalikan nilai setiap jawaban dengan angka yang memberikan nilai tersebut,
menambahkannya selama 5 rentang dan membaginya dengan jumlah total, tetapi itu adalah
lebih mudah untuk menghitung, jika kita menulis ulang rumus itu dalam hal proporsi.
5 5 5
Ni
X = (X NiXi)=N = X Xi = X piXi :
N
saya = 1 saya = 1 saya = 1

Kita dapat melakukan hal yang sama untuk menghitung varians, memberikan
5
2 2
=X pi(Xi X) :

saya = 1

Jadi dalam tabel, kami memberikan nilai Xi ; proporsi pi (perhatikan jumlahnya satu);
hitung produk piXi ; lalu jumlahkan ini untuk mendapatkan X = 2:05: Kemudian kita hitung
(Xi X) dan pi(Xi X) (catat jumlah ini sampai nol). Kemudian kalikan pi(Xi X) dengan
2
(Xi X) untuk mendapatkan pi (Xi X) : Kami menjumlahkan ini untuk mendapatkan varians. Perhitungannya
diberikan di bawah ini.

2
Xi pi piXi (Xi X) pi (Xi X) pi (Xi X)
20 0:15 3 48:330375 17:95 2:6925
10 0:25 2:5 15:800625 7:95 1:9875
2:5 0:18 0:45 0:03645 0:45 0.081
5 0:24 1:2 11:9286 7:05 1:692
15 0:18 2:7 17:05 3:069 52:32645
Jumlah 1 2:05 2:25 0 128:4225

Karena varians = 2
= 128:4225 simpangan baku, akar kuadratnya adalah
11:33:

45
Machine Translated by Google

Untuk meringkas perkiraan rata-rata responden SBE adalah untuk pertumbuhan harga
rumah 2,05, dengan standar deviasi 11,33= p 128:4225, yang menunjukkan kisaran besar
ketidaksetujuan. Rata-rata jatuh dalam kisaran yang sama dengan median, yang juga
menunjukkan bahwa distribusinya cukup simetris, tetapi bimodal dengan sekitar seperempat
berpikir harga akan naik antara 5 dan 15%, dan seperempat berpikir bahwa mereka akan turun
hingga 10%.
Pada bulan Juni 2004 ketika survei dilakukan, rata-rata harga rumah di Inggris menurut
Nationwide Building Society adalah £151.254. Pada bulan Juni 2007, tiga tahun kemudian, itu
adalah £ 184.074; kenaikan 22%, meskipun harga kemudian turun dan pada bulan Juni 2009
adalah £ 156.442.

6.4. Contoh Latar Belakang: risiko dan pengembalian

Ketika menilai apakah investasi tertentu, misalnya membeli saham perusahaan tertentu) bermanfaat,
Anda perlu mencoba dan menilai pengembalian yang diharapkan (dividen ditambah keuntungan modal
untuk saham ekuitas) dan risiko yang diharapkan. Meskipun masa lalu tidak selalu merupakan panduan
yang dapat diandalkan untuk masa depan, kami menggunakan data masa lalu untuk mencoba dan
mendapatkan perkiraan kemungkinan risiko dan pengembalian di masa depan. Varians (atau deviasi
standar) pengembalian saham adalah cara standar untuk mengukur risiko atau volatilitas saham. Anda
ingin memiliki pengembalian rata-rata yang lebih tinggi tetapi jika Anda menghindari risiko, Anda
menginginkan varians yang lebih rendah: dengan pilihan dua saham dengan pengembalian yang
diharapkan sama, Anda akan memilih yang memiliki varians lebih rendah. Saham yang lebih berisiko
memberikan pengembalian yang lebih tinggi. Salah satu ukuran yang mencerminkan keduanya adalah Rasio Sharpe:

Ri R
saya

rasio perbedaan antara rata-rata pengembalian saham dari tingkat bunga bebas risiko dengan
standar deviasi pengembalian saham. Ada berbagai ukuran kinerja keuangan lainnya yang
menggabungkan risiko dan pengembalian.
Anda dapat mengurangi risiko dengan mendiversifikasi portofolio Anda, memegang lebih dari
satu saham. Misalkan ada dua saham, dengan pengembalian rata-rata dan 1 dan 2 ; varians 21

22;
dan kovarians di antara mereka dari 12: Misalkan Anda membentuk Portofolio
dengan saham w di saham satu dan (1 w) di saham dua. Rata-rata pengembalian portofolio
adalah
=w + (1 w) 2
p 1

varians portofolio adalah


2 22 222
p
=w1 + (1w) + 2w(1w) 12:

46
Machine Translated by Google

Oleh karena itu, jika kovarians antar saham negatif, portofolio akan memiliki
varians yang lebih kecil: ketika satu saham naik, yang lain turun. Bahkan jika kovarians
2 = 2 = 2
adalah nol ada keuntungan dari diversifikasi. Misalkan = 0. 1 2 dan 12
Kemudian

2 22 22
=w + (1w)
p
2 2
= (1 + 2(w w))
2 2 2
sejak w < 1; lalu aku < w dan suku kedua negatif, membuat p
< :

47
Machine Translated by Google

7. Data Ekonomi dan Keuangan I: angka dan grafik


7.1. Tabel dan Perhitungan

Data biasanya akan datang dalam Tabel, baik elektronik atau hard-copy. Saat membuat
tabel Anda sendiri, pastikan Anda memasukkan Judul, definisi lengkap
variabel, satuan ukuran dan sumber data.
Perjelas unit pengukuran dan rasakan urutan besarnya:
apa nilai-nilai khas, apa kisaran (nilai tertinggi dan terendah). Kapan
membandingkan seri atau membuat grafiknya bersama-sama memastikan mereka sebanding
unit.
Perhatikan tabel berikut.

Produk Nasional Bruto (miliar US$ 1995 konstan), Populasi


(jutaan), Pengeluaran Militer (miliaran konstan 1995 US$) dan
jumlah angkatan bersenjata (ribuan) di Maju dan Berkembang
Negara, 1985 dan 1995.
1985 1995
GNP
Penduduk 21190 23950
Berkembang 4184 7010
Maju
1215.7 1151.5
Dikembangkan 3620.8 4520.0
Mengembangkan Pengeluaran Militer
1100.8 667.8
230.0 196.7
Dikembangkan Berkembang di Angkatan Bersenjata
Pengeluaran 11920 7667
Militer Dunia 16150 15120
dan Transfer Senjata Sumber Berkembang yang Berkembang, Senjata AS
Badan Pengendalian dan Perlucutan Senjata. Grup yang dikembangkan mencakup 33
negara berpenghasilan tinggi per kapita, seluruh dunia sedang berkembang.

Produk Nasional Bruto, GNP, dan Produk Domestik Bruto adalah dua hal yang berbeda
ukuran output suatu negara. GNP termasuk produksi oleh warga negara
negara, PDB mencakup produksi di dalam batas negara
baik oleh warga negara atau orang asing. Selisihnya adalah pendapatan properti bersih dari

48
Machine Translated by Google

luar negeri. Definisi Populasi sangatlah mudah, meskipun sulit untuk menghitung semua
orang. Jumlah angkatan bersenjata dapat menimbulkan masalah definisi di negara-
negara dengan unit paramiliter seperti Gendarmerie Prancis, apakah mereka angkatan
bersenjata atau tidak? Menentukan apa yang harus dimasukkan dalam pengeluaran
militer juga menimbulkan kesulitan dan banyak negara merahasiakan apa yang mereka
belanjakan untuk militer. Ada margin kesalahan yang cukup besar pada semua angka
ini. Banyak ukuran ekonomi hanya ROM (urutan besaran kasar) yang lain adalah WAG
(tebakan liar).
Dari tabel ini kita dapat menghitung ukuran turunan seperti (a) pendapatan per kapita,
GNP per kepala, dengan membagi GNP dengan populasi untuk dunia secara keseluruhan
dan untuk negara maju dan berkembang (kita harus menghitung total dunia) ( b) tingkat
pertumbuhan tahunan rata-rata penduduk atau pendapatan per kapita (GNP per kepala)
antara tahun 1985 dan 1995; (c) persentase bagian pengeluaran militer dalam PDB (d)
jumlah orang dalam angkatan bersenjata per 1000 penduduk untuk dunia secara
keseluruhan dan untuk negara maju dan berkembang pada tahun 1985 dan 1995.

Saat melakukan perhitungan ini, sangat penting untuk berhati-hati tentang unit.
Variabel-variabel ini semuanya diukur dalam satuan yang berbeda dan rasio akan
bergantung pada satuan pembilang dan penyebutnya. Mengekspresikan satuan sebagai
pangkat 10 seringkali berguna. 1 = 100 ; 10 = 101 ; 100 = 102 ; 1; 000; 000 = 106 :
Kekuatan memberi Anda jumlah nol setelah satu.
GNP dan Pengeluaran Militer diukur dalam miliaran AS, seribu juta, 109 US$ 1995,
jadi rasio PDB pengeluaran militer adalah suatu proporsi. Untuk negara maju pada tahun
1985 adalah 1100:8=21190 = 0,0519 untuk dikonversi ke persen dikalikan 100, 5,19%
dari GNP dikhususkan untuk militer.
Populasi diukur dalam jutaan, 106 ; jumlah angkatan bersenjata dalam ribuan, 103 .
Bagi jumlah angkatan bersenjata dengan jumlah penduduk untuk negara maju pada
tahun 1985 adalah 11920=1215:7 = 9:8: Ini dalam satuan pembilang dibagi penyebut:
103=106 = 1036 = 103 ; satu per seribu. Jadi ada kira-kira 10 anggota angkatan
bersenjata per seribu penduduk di negara-negara maju pada tahun 1985; sekitar 1% dari
populasi.
GNP per kapita adalah GNP (109 ) dibagi dengan populasi (106 ) begitu juga (103 )
sehingga angka 1985 untuk negara maju 21190=1215 = 17:44; diukur dalam ribuan
(103 ): Jadi pendapatan rata-rata di negara maju pada tahun 1985 pada tahun 1995 dolar
adalah sekitar $17; 500 membandingkan angka untuk negara berkembang dengan
4184=3620:8 = 1:155; $1155: Tingkat pertumbuhan GNP untuk negara maju 1985-1995
adalah (23950

49
Machine Translated by Google

21190)=21190 = 23950=21190 1 = 0:13; 13% selama sepuluh tahun, kira-kira 1:3% per tahun.
Perhatikan apakah tingkat pertumbuhan dinyatakan sebagai proporsi (0:13) atau persentase
(13%) dan periode penghitungannya berakhir.

7.2. Grafik

Grafik biasanya merupakan cara paling terbuka untuk menyajikan data. Lihat contoh di 7.7.
Untuk data deret waktu, titik awalnya adalah grafik garis, hanya plot dari waktu ke waktu. Jika
Anda ingin memplot lebih dari satu deret pada grafik untuk melihat apakah deret tersebut
bergerak bersama, pastikan bahwa deret tersebut memiliki skala yang sama. Jangan
menempatkan terlalu banyak seri pada grafik yang sama. Saat Anda melihat grafik deret
waktu, cari tren (pergerakan stabil ke atas, atau lebih jarang ke bawah, dalam deret); pola
musiman (jika data triwulanan atau bulanan); siklus, periode boom atau resesi yang menyebar
selama beberapa tahun; outlier yang terlihat tidak sejalan dengan angka lainnya. Pencilan
dapat dihasilkan oleh peristiwa yang tidak biasa (perang, krisis keuangan, dll) atau mungkin
hanya kesalahan dalam data.
Diagram pencar memplot satu seri terhadap yang lain dan biasanya digunakan untuk
menyelidiki apakah ada hubungan antara dua variabel. Lihat untuk melihat seberapa dekat
asosiasinya, apakah positif atau negatif, apakah ada outlier yang tidak sesuai dengan pola
standar.
Histogram, atau distribusi frekuensi, adalah gambar yang memberikan jumlah (atau
proporsi) pengamatan yang termasuk dalam rentang tertentu. Kami akan menggunakan ini
secara ekstensif dalam kuliah. Lihat apakah distribusinya unimodal atau bimodal; apakah itu
miring; seberapa tersebarnya dan apakah ada outlier.

7.3. Transformasi

Dalam banyak kasus, kami menghilangkan efek tren, perubahan tingkat harga, dll. dengan
bekerja dengan tingkat pertumbuhan, atau dengan rasio. Dalam ekonomi dan keuangan rasio
tertentu cenderung cukup stabil (yaitu tidak bertren). Contohnya adalah Average Propensity
to Consume (rasio Konsumsi terhadap Pendapatan) atau Saving Ratio. Karena pendapatan
sama dengan tabungan ditambah konsumsi Y = S + C, kecenderungan mengkonsumsi rata-
rata sama dengan satu dikurangi tingkat tabungan AP C = C=Y = 1S=Y .
Dimana Y adalah pendapatan, tabungan S, konsumsi C, rasio tabungan SR, kecenderungan
mengkonsumsi rata-rata A C. SR dan AP C dapat dinyatakan sebagai proporsi seperti di sini
atau dikalikan dengan 100 untuk memberikan persen. Dalam keuangan, kami bekerja dengan
rasio seperti Price-Earnings Ratio atau Dividend Yield. Perhatikan rasio ini dapat dibandingkan

50
Machine Translated by Google

lintas negara, karena unit mata uang dalam pembilang dan penyebut dibatalkan.

Teori akan sering memberi tahu Anda variabel apa yang harus dibangun, mis
-Suku Bunga Riil sama dengan tingkat bunga nominal biasa dikurangi
(diharapkan) tingkat inflasi;
-nilai tukar riil, nilai tukar nominal kali rasio indeks harga asing terhadap domestik;
-kecepatan sirkulasi, rasio PDB nominal terhadap jumlah uang beredar.

7.4. Akun Nasional

Output suatu perekonomian biasanya diukur dengan Produk Domestik Bruto, PDB, atau
kadang-kadang Produk Nasional Bruto, GNP. Langkah-langkah ini merupakan bagian dari
sistem Neraca Nasional, yang dimulai dari identitas bahwa output sama dengan pengeluaran
sama dengan pendapatan. Apa pun yang diproduksi, output, dijual kepada seseorang, dan
kemudian pengeluaran mereka, dan uang yang dihasilkan oleh penjualan dibayarkan kepada
seseorang, itu adalah pendapatan mereka. Pengeluaran terdiri dari konsumsi investasi
Ct ; ditambah
It ,
ditambah pengeluaran
pemerintah pemerintahtransfer)
untuk pembayaran untuk barang dan jasaekspor
Gt ; ditambah (yaitu Xt
tidak termasuk
dikurangi pengeluaran
impor Mt :
Pendapatan terdiri dari upah Wt ditambah laba Pt : Dalam periode
; apapun:

Yt = Ct + It + Gt + Xt Mt = Wt + Pt :
Output yang diproduksi tetapi tidak dijual, yang tersisa di gudang diperlakukan sebagai
perubahan dalam bagian persediaan dari investasi oleh perusahaan. Investasi meliputi
Pembentukan Modal Tetap Domestik Bruto dan perolehan persediaan. Meskipun, pada
prinsipnya, output, pengeluaran, dan pendapatan adalah sama, dalam praktiknya karena
kesalahan pengukuran, keduanya tidak sama dan 'item penyeimbang' ditambahkan untuk
membuatnya cocok. Cakupan dapat bersifat nasional (oleh warga negara) atau domestik (di
dalam batas negara). Perbedaan antara Pendapatan Nasional Bruto dan Produk Domestik
Bruto adalah pendapatan bersih (menerima pembayaran dikurangi) dari seluruh dunia.
Ukurannya bisa bruto dari depresiasi stok modal atau setelah dikurangi. Berhati-hatilah dengan
ukuran Kotor dan Bersih, karena sering kali tidak jelas dari namanya apa yang terjaring.
Ukurannya bisa pada harga yang sebenarnya dibayar (harga pasar) atau apa yang sebenarnya
diterima produsen (biaya faktor) perbedaannya adalah pajak tidak langsung dikurangi subsidi.
Konvensi akun nasional Inggris didasarkan pada Sistem Akun Eropa 1995 dan diterbitkan
dalam Buku Biru.
PDB atau agregat pendapatan nasional lainnya mengukur output yang dipasarkan dan
ada banyak kegiatan yang ditinggalkan. Ini termasuk kegiatan domestik (rumah tangga

51
Machine Translated by Google

produksi), dampak lingkungan, kegiatan ilegal, dll. Jika ada peningkatan kejahatan yang
menyebabkan lebih banyak penjaga keamanan yang dipekerjakan dan lebih banyak
penguncian, ini meningkatkan PDB. Ada berbagai upaya untuk menyesuaikan total untuk
efek ini meskipun, sejauh ini, mereka belum diadopsi secara luas. Anda harus menyadari
keterbatasan PDB dll sebagai tindakan. Ada diskusi yang baik tentang isu-isu dan alternatif
dalam Laporan oleh Komisi Pengukuran Kemajuan Ekonomi dan Sosial (2009) tersedia di
www.stiglitz-sen-Ötoussi.fr.
Akun-akun tersebut dibagi berdasarkan sektor. Sektor swasta mencakup perusahaan
(sektor perusahaan biasanya dibagi menjadi keuangan dan non-keuangan) dan rumah
tangga; sektor publik mencakup pemerintah umum (yang mungkin nasional atau lokal) dan
kadang-kadang badan usaha milik negara, meskipun mereka mungkin termasuk dalam
sektor korporasi; sektor luar negeri meliputi perdagangan. Sesuai dengan arus keluaran,
pengeluaran dan pendapatan, terdapat arus keuangan antar sektor. DeÖne Tt sebagai
pajak dikurangi pembayaran transfer. Total pendapatan faktor Yt Tt dikurangi pajak
ditambah pembayaran transfer (misalnya pensiun negara atau tunjangan pengangguran)
dikenal sebagai pendapatan disposabel. Kurangi Tt dari kedua sisi identitas pendapatan-pengeluaran

Yt Tt = Ct + It + Gt Tt + Xt Mt
perhatikan bahwa penghematan St = Yt Tt Ct : Pindahkan Ct dan It ke sisi kiri untuk memberikan:

(St It) = (Gt Tt) + (Xt Mt)

(St It) + (Tt Gt) + (Mt Xt) = 0


tiga istilah dalam kurung mewakili apa yang masing-masing sektor - swasta, publik, luar
negeri - perlu pinjam atau pinjam dan total pinjaman harus sama dengan total pinjaman.
Jika tabungan lebih besar dari investasi, sektor swasta memiliki surplus kas yang dapat
dipinjamkan kepada sektor publik atau luar negeri. Jumlahnya nol karena untuk setiap
peminjam pasti ada pemberi pinjaman.

7.5. Pengangguran

Kita sering kali memiliki konsep teoretis dan perlu memberikan 'definisi operasional',
seperangkat prosedur yang tepat yang dapat digunakan oleh kantor statistik, untuk
mendapatkan ukuran. Hal ini menimbulkan pertanyaan seperti apa ukuran operasional
terbaik dan seberapa baik itu sesuai dengan konsep teoritis tertentu. Pengangguran adalah
contohnya. Ada sejumlah konsep teoritis yang berbeda tentang pengangguran dan sejumlah
cara yang berbeda untuk mengukurnya.

52
Machine Translated by Google

Apakah menurut Anda orang-orang berikut ini menganggur: seorang


siswa yang mencari pekerjaan musim panas yang tidak dapat menemukannya;
seorang pria berusia 70 tahun yang akan mengambil pekerjaan jika ada yang
ditawarkan; seorang ibu yang menjaga anak-anaknya yang akan mengambil pekerjaan jika dia bisa
menemukan penitipan anak yang baik; seorang aktor 'beristirahat' di antara pertunangan; seseorang yang
telah diberhentikan dan hanya akan menerima pekerjaan di bidang tempat mereka bekerja sebelumnya
dengan gaji yang sama atau lebih baik?

Salah satu caranya adalah Claimant countí, yaitu jumlah yang terdaftar sebagai pengangguran
dan penerima manfaat. Tapi ini jelas sangat sensitif terhadap keputusan politik dan administratif yang
tepat mengenai siapa yang berhak menerima manfaat.
Alternatifnya adalah survei, yang menanyakan orang-orang usia kerja pertanyaan seperti (i) apakah
Anda saat ini bekerja; jika tidak (ii) apakah Anda menunggu untuk memulai pekerjaan; jika tidak
(iii) apakah Anda mencari pekerjaan dalam empat minggu terakhir.

Mereka yang termasuk dalam kategori (iii) akan dihitung sebagai pengangguran.

7.6. Contoh: suku bunga riil

Perang Dunia I berakhir pada November 1918. Tabel di bawah ini memberikan data persentase tingkat
pengangguran U; Indeks Harga Eceran 1963=100, RP I; imbal hasil Surat Perbendaharaan Negara 3
bulan, R; (ini tidak dikeluarkan selama perang); PDB per kapita pada tahun 1913 harga Y ; dan nilai
tukar dolar-sterling, $=$ (sterling tidak dapat ditukarkan selama perang); untuk tahun 1918-1922.

Y ear U RP IRY $=$ 1918 0:8 42 54 1919


2:1 56 3:5 48 4:42 1920 2:0 52 3:66
6:2 47
1921
12:9 47 4:6 42 3:85 1922 14:3 38 2:6 44
4:43

(a) Hitung laju inflasi dan laju pertumbuhan pendapatan per kapita 1919-1922.

(b) Hitung tingkat bunga riil ex post 1919-1922? (c) Jelaskan


perbedaan antara tingkat bunga riil ex ante dan ex post. (d) Gunakan data untuk mengevaluasi
proposisi: Kebijakan moneter pascaperang sangat kontraktif untuk melumpuhkan perekonomian
sehingga sterling dapat

53
Machine Translated by Google

kembali ke emas pada paritas sebelum perang 4,87. Konsekuensinya dilanjutkan


resesi dan pengangguran massal.
Menjawab
Y pertumbuhan telinga% INF% EARIR EP RIR $=$
1918
1919 11 33:3 29:8 10:6 4:42
1920 7:1 13:3 15:8 3:66
1921 2 11 9:6 14:2 23:7 3:85
1922 5 19: 1 21:7 4:43

(a) Pertumbuhan adalah 100(Yt=Yt1 1): Untuk tahun 1919 adalah 100((48=54) 1) 11%; per
pendapatan kapita turun lebih dari 10%, dan terus turun hingga tahun 1921. Penurunan ini menghasilkan
meningkatnya pengangguran. Inasiasi dihitung sebagai persentase perubahan dalam RPI.
Harga naik antara tahun 1918 dan 1919, tetapi kemudian turun memberikan ináasi negatif,
deaasi. Antara tahun 1919 dan 1922 harga turun hampir sepertiga.
(b) Jika Anda meminjamkan £ 1 pada 15% selama setahun Anda mendapatkan £ 1,15 pada akhir tahun, tetapi
jika harga naik 10%, selama setahun apa yang dapat Anda beli dengan £ 1,15 Anda telah jatuh,
tingkat pengembalian riil hanya 5% = 15% -10%. Ini adalah expost (dari sesudahnya)
tingkat, menggunakan ináation aktual dari waktu ke waktu Anda meminjamkan. Jadi ex post minat yang nyata
tarif untuk tahun 1919 adalah EPRIR=3:5 (7:1) = 10:6:
(c) Ketika Anda meminjamkan uang, Anda tidak tahu berapa laju inflasi
jadi, tingkat ex ante (dari sebelumnya) adalah tingkat bunga dikurangi tingkat yang diharapkan dari
inasi masa depan. Dalam banyak kasus, tingkat ináasi yang diharapkan dapat diperkirakan
dengan tingkat inflasi saat ini, yang Anda tahu, jadi tingkat bunga riil ex ante
adalah tingkat bunga nominal dikurangi tingkat inflasi saat ini. Jadi mantan
tingkat bunga riil adalah EARIR=3:5 33:3 = 29:8: Pada awalnya ex ante
tingkat riil negatif karena inflasi lebih tinggi dari tingkat bunga nominal,
selanjutnya dengan tingkat nominal yang cukup tinggi dan deáation (ináation negatif) nyata
tarif menjadi sangat tinggi.
(d) Pernyataan itu benar; kombinasi dari pengeluaran militer yang berkurang tajam dan tingkat bunga
riil yang tinggi menyebabkan deaasi (penurunan harga), penurunan output,
meningkatnya pengangguran dan setelah tahun 1920 penguatan nilai tukar. Itu
Menteri Keuangan, Winston Churchill mengembalikan sterling ke standar emas pada keseimbangan sebelum
perang pada tahun 1925. Keynes menyalahkan kebijakan ini untuk depresi
dari awal 1920-an.

54
Machine Translated by Google

7.7. Contoh: Apakah tahun sembilan puluhan dan tahun sembilan puluhan BAGUS?

7.7.1. pengantar

Mervyn King, Gubernur Bank of England, menggambarkan lingkungan ekonomi Inggris pada akhir
abad ke-20 dan awal abad ke-21 sebagai NICE: non-ináationary, terus berkembang. Selanjutnya
menjadi VILE: ináasi yang mudah berubah, ekspansi yang lebih sedikit. Contoh ini menggunakan
statistik deskriptif dan grafik untuk membandingkan pertumbuhan dan inflasi Inggris Raya selama
periode 1992-2007, dengan perilaku mereka sebelumnya untuk melihat betapa bagusnya periode ini.

7.7.2. Data

Seri asli, dari Kantor Statistik Nasional, adalah untuk 1955Q1-2009Q2, Qt = Produk Domestik Bruto,
ukuran volume rantai, harga konstan 2003, penyesuaian musiman (ABMI) dan 1955Q1-2009Q1 Et =
Produk Domestik Bruto dengan harga pasar : Harga saat ini: Penyesuaian musiman (YBHA). Indeks
harga, deáator PDB, adalah Pt = Et=Qt : Pertumbuhan (persentase perubahan output), gt ; dan
ináation (persentase perubahan harga), t ; diukur pada kuartal yang sama pada tahun sebelumnya
sebagai:

gt = 100 (ln(Qt) ln(Qt4)) = 100


t (ln(Pt) ln(Pt4)):
Perbedaan tahunan seperti itu memuluskan rangkaian dan akan menghilangkan musim jika mereka
belum disesuaikan secara musiman. Perhatikan bahwa dengan mengambil perubahan empat kuartal,
sedangkan data untuk output dan harga dimulai pada 1955Q1, data untuk pertumbuhan dan inflasi
hanya dimulai pada 1956Q1.

7.7.3. Grafik garis

Pola luas peristiwa ekonomi Inggris dapat dilihat dari grafik garis di bawah ini untuk deret waktu
pertumbuhan dan inflasi. Kebijakan ekonomi Inggris sejak Perang Dunia II dapat digambarkan sebagai
pencarian target. Awalnya targetnya adalah neraca pembayaran untuk mendukung nilai tukar tetap.
Kemudian dengan berakhirnya sistem nilai tukar tetap Bretton Woods pada awal 1970-an, terjadi
pergeseran ke target moneter untuk mengendalikan inflasi, pergeseran yang menjadi lebih jelas
dengan pemilihan Nyonya Thatcher pada tahun 1979. Namun, agregat moneter terbukti sangat tidak
stabil dan ada peralihan ke target nilai tukar di

55
Machine Translated by Google

pertengahan 1980-an, yang berpuncak pada bergabungnya Mekanisme Nilai Tukar Eropa.
Dengan dikeluarkannya sterling dari ERM pada bulan September 1992, target inflasi diadopsi.
Bank of England diberi tanggung jawab independen untuk menargetkan inflasi, ketika Pemerintah
Buruh terpilih pada tahun 1997. Sejarah ini tercermin dalam grafik pertumbuhan dan inflasi di
bawah ini. Pola "stop-go" pada tahun 1950-an dan 1960-an terlihat jelas, kemudian ada
puncaknya ketika pertumbuhan mencapai hampir 10% selama "Barber Boom" pada awal 1970-
an setelah runtuhnya sistem nilai tukar tetap Bretton Woods. Anthony Barber adalah Kanselir
konservatif pada saat itu. Guncangan harga minyak pertama tahun 1973 setelah perang Arab-
Israel mengirim ekonomi ke dalam resesi yang dalam, dengan pertumbuhan negatif di sebagian
besar kuartal antara 1974Q1 dan 1975Q4. Selama tahun 1976 Inggris harus meminjam dari IMF.
Pertumbuhan pulih di akhir 1970-an, sebelum resesi lebih lanjut di awal 1980-an menyusul
kejutan harga minyak kedua setelah revolusi Iran dan kebijakan moneter Nyonya Thatcher.
Pertumbuhan pulih pada akhir 1980-an dengan booming di bawah Nigel Lawson, Kanselir
Konservatif, kemudian tenggelam ke dalam resesi lagi pada awal 1990-an, mungkin diperburuk
oleh nilai tukar tetap yang diperlukan oleh keanggotaan Mekanisme Nilai Tukar Eropa. Inggris
meninggalkan ERM pada bulan September 1992 dan mengadopsi penargetan inflasi, dengan
kemerdekaan Bank of England pada tahun 1997. Kemudian ada periode relatif stabil, sebelum
dampak Credit Crunch 2007 mulai berdampak pada perekonomian. Output turun 5,8% di tahun
ini hingga 2009Q2, terendah yang diamati dalam sampel ini; namun angka tahun 2009
kemungkinan akan direvisi seiring dengan tersedianya lebih banyak data.

Inaasi cukup rendah, di bawah 10%, meskipun fluktuatif selama tahun 1960-an dan 1970-an.
Pada pertengahan 1970-an melonjak hingga hampir 25%, sebelum jatuh kembali ke hampir 10%,
kemudian naik lagi lebih dari 20% setelah pemilihan Nyonya Thatcher pada 1979. Kemudian
turun di bawah 5%, dengan ledakan di akhir 1980-an. dan awal 1990-an, sebelum kemudian
stabil pada tingkat rendah. Ada sejumlah ukuran inflasi, CPI, RPI, dll. yang berbeda, dan mereka
menunjukkan pola yang sedikit berbeda dari deáator PDB yang digunakan di sini.

56
Machine Translated by Google

PERTUMBUHAN

10

-2

-4

-6
55 60 65 70 75 80 85 90 95 00 05

INFLASI
30

25

20

15

10

0
55 60 65 70 75 80 85 90 95 00 05

57
Machine Translated by Google

35
Seri: PERTUMBUHAN

30 Contoh 1955Q1 2009Q2


Pengamatan 214

25
Berarti 2.374050
median 2.508702
20 Maksimum 9.516651
Minimum -5.795526 Std.
Kemiringan
Dev. 2.161040
15 -0.678412 Kurtosis 5.299602

10

5 Jarque-Bera 63.56818 Probabilitas


0,000000

0
-6 -4 -2 0 2 4 6 8 10

7.7.4. Distribusi frekuensi.

Histogram dan ringkasan statistik yang menggambarkan distribusi pertumbuhan


dan ináasi untuk seluruh periode ditampilkan berikutnya. Tingkat pertumbuhan rata-rata
sekitar 2,5%, tampaknya menjadi fitur jangka panjang dari ekonomi Inggris, mode
adalah antara 1,5-3%. Distribusinya tidak terlalu normal, dengan sedikit negatif
miring dan ekor sedikit lebih gemuk dari distribusi normal. Jika variabel acak adalah
terdistribusi normal, koefisien skewness harus nol dan koefisien
2
dari kurtosis 3. Statistik Jarque-Bera (2); tes , yang didistribusikan sebagai
apakah skewness dan kurtosis berbeda secara signifikan dari nilai-nilai ini:
Nilai p, probabilitas hipotesis nol normalitas menjadi benar, menunjukkan
bahwa hipotesis bahwa pertumbuhan normal ditolak. Jika pertumbuhan normal
yang didistribusikan akan sangat tidak mungkin untuk mengamati nilai -5,8% seperti pada 2009Q2,
yang hampir 4 standar deviasi dari mean. Ináation bahkan kurang normal
dari pertumbuhan seperti yang ditunjukkan oleh nilai statistik JB yang lebih besar dan sangat kuat
condong positif karena perbedaan antara mean dan median dan
koefisien skewness show. Rata-rata sekitar 5% tidak terlalu khas
dari seluruh periode, modus adalah antara 2% dan 3%.

58
Machine Translated by Google

50
Seri: INFLASI
Contoh 1955Q1 2009Q2
40 Pengamatan 213

Rata- 5.656730
30 rata 4.360406
Median 24.87334
Maksimum 0.310697
20 Minimum Std. Dev.4.690943
Kurtosis 1.905004
kemiringan 6.913777
10
Jarque-Bera 264.7751 Probabilitas
0,000000
0
0246 81012141618202224

7.7.5. Hubungan antara pertumbuhan dan ináasi

Diagram pencar di bawah ini memplot ináasi terhadap pertumbuhan untuk seluruh periode.
Ada hubungan negatif, korelasinya -0,4, tetapi tidak dekat, dan
asosiasi terutama berasal dari periode krisis, dengan inflasi tinggi dan rendah
pertumbuhan di kuadran kiri atas pencar. Setiap hubungan antara
output dan ináation diperumit oleh penyesuaian yang lambat dan pengaruh dari yang lain
faktor. Perhatikan bahwa pola yang dijelaskan oleh grafik di bagian ini adalah spesifik
untuk periode ini dan ke Inggris; negara lain dan periode lain mungkin menunjukkan lainnya
fitur.

59
Machine Translated by Google

30

25

20

15

10

0
-8 -4 0 4 8 12

PERTUMBUHAN

60
Machine Translated by Google

7.7.6. Perbedaan antar periode

Kami akan membagi sampel menjadi periode A, 37 tahun 1956-1992, dan periode B 15
tahun 1993-2007. Tabel tersebut memberikan mean, median, standar deviasi, koefisien
skewness dan kurtosis dan jumlah pengamatan untuk pertumbuhan dan inflasi selama
dua periode ini Dibandingkan dengan periode pertama, inflasi jauh lebih rendah dan
kurang stabil, sementara pertumbuhan sedikit lebih tinggi dan jauh lebih tidak stabil di
periode kedua. Standar error pertumbuhan rata-rata pada periode A adalah 2:3= p 148
0:18 dan pada periode B adalah 0:7= p 60 0:0:09: Jadi interval kepercayaan 95% untuk
periode A rata-rata pertumbuhan adalah 2 :3 2(0:18), yaitu 2:66 banding1:94; sedangkan
untuk periode B adalah 2:9 2(0:09) yaitu 3:08 hingga 2:72: Tidak tumpang tindih.
Pertumbuhan dan ináasi, A: 1956-1992, B: 1993-2007
Inflasi
Periode gr ABAB
Berarti 7:1 2:3 2:9 2:5
Median 5:8 2:2 2:9 2:5
St:Pengembang 5:0 0:7 2:3 0:7
Kemiringan 1:5 0:2 0:2 0:4
Kurt 5:4 3:8 3:0 2:7
NObs 148 60 148 60

7.7.7. Kesimpulan

Dibandingkan dengan sejarah sebelumnya (dan selanjutnya?), periode 1993-2007 bagus.


Dari yang tinggi dan fluktuatif, ináation menjadi rendah dan stabil. Pertumbuhan sedikit
lebih tinggi dan jauh lebih tidak stabil. Meskipun ada siklus ekonomi 1997-2007, itu kurang
terasa dibandingkan tahun-tahun sebelumnya. Jadi ada beberapa dasar untuk klaim
Gordon Brown, Kanselir saat itu Perdana Menteri, untuk menghapus boom dan bust.
Apakah ini masalah keberuntungan atau kebijakan yang baik tetap menjadi bahan
perdebatan, seperti halnya apakah kebijakan uang mudah tahun-tahun ini berkontribusi
pada krisis keuangan berikutnya. "Moderasi Hebat" ini tidak terbatas pada Inggris, tetapi
tampaknya telah menjadi ciri umum banyak negara maju. Ada guncangan ekonomi global
selama periode ini: krisis Asia 1997-8; default Rusia dan krisis LTCM tahun 1998; booming
dan kegagalan dot.com tahun 2001; perputaran harga minyak, yang naik dari sekitar $10
pada tahun 1998 menjadi $147 pada tahun 2008; dan serangan 9/11 dan perang di Irak
dan Afghanistan. Namun terlepas dari guncangan ini, ada pertumbuhan non-inasiatif yang
mulus di Inggris, seperti di banyak negara. Apakah Moderasi Hebat hanyalah selingan
sementara dari

61
Machine Translated by Google

stabilitas dalam sistem yang rawan krisis masih harus dilihat, sebagaimana peringatan pada produk
keuangan mengatakan: kinerja masa lalu belum tentu menjadi panduan untuk masa depan.

8. Latihan terapan I: Rasio dan statistik deskriptif


Latihan ini harus dilakukan sendiri. Kami akan berasumsi bahwa Anda telah melakukan latihan ini
dan terbiasa dengan materi ini, sehingga kami dapat mengatur soal ujian dengan menggunakannya.
Ini akan dimulai di kelas spreadsheet. Data tersedia di halaman web ASE. Mereka dibangun oleh
Robert J. Shiller, memperbarui seri di Robert J Shiller, Market Volatility, MIT Press 1989. Bukunya
yang terakhir, Irrational Exhuberance, Princeton University Press 2000 adalah deskripsi yang baik
tentang gelembung pasar saham di akhir abad kedua puluh. abad. Pada akhir data ini, Januari 2000,
S&P adalah 1425, puncaknya pada Maret 2000 pada 1527 kemudian dari 800 (diambil dari FT World
Markets di tabel sekilas). Periksa apa yang telah dilakukan sejak; gelembung (ketika harga melonjak
ke tingkat yang tidak berkelanjutan) dan krisis keuangan (ketika harga kembali normal) adalah fitur
sistem yang berulang.

8.1. Data

Ini akan berada di le Excel yang disebut Shiller.xls. Salin le ini ke direktori Anda sendiri dan ketika
Anda telah menyelesaikan latihan, salin le baru ke disk Anda sendiri menggunakan
nama baru.

Di le, baris 2 hingga 131, berisi data AS dari tahun 1871 hingga 2000; baris 1 berisi judul: A-
YEAR B-NSP: Indeks Harga Saham (S&P komposit Standard & Poors) dalam harga saat ini (istilah
Nominal), angka Januari.

C-ND: Dividen per saham dalam harga saat ini, rata-rata untuk tahun ini.
D-NE: Laba per saham dalam harga saat ini, rata-rata untuk tahun ini.
ER: Tingkat bunga, rata-rata untuk tahun ini.
F-PPI:Indeks harga produsen, angka Januari, rata-rata tahun 1967=100.
Huruf A sampai F menunjukkan kolom dalam spreadsheet. Catatan 2000 data
hilang untuk ND, NE, R.

62
Machine Translated by Google

8.2. Transformasi: rasio, tingkat pertumbuhan, koreksi inflasi, dll

Di kolom G buatlah Price Earnings Ratio (mundur). Ketik PER di sel G1 sebagai judul. Masukkan
=B3/D2 di sel G3. Salin ini untuk sisa tahun yang berakhir di G131. Rasio pendapatan harga
adalah ukuran nilai yang mendasari saham, berapa banyak yang harus Anda bayar untuk
membeli aliran pendapatan.
Sorot data untuk PER melalui G3:G131. Gunakan panduan Bagan (pada bilah alat) dan pilih
grafik garis, sub-tipe kiri atas, pilih berikutnya dan lanjutkan ke berikutnya. Beri komentar pada
gambar. Dapatkah Anda mengidentifikasi Booming Pasar Saham pada akhir 1920-an dan 1990-
an. Apa yang terjadi selanjutnya dalam kedua kasus tersebut? Apa fitur lain dari data yang dapat
Anda lihat?
Dengan cara yang sama, buat variabel baru berikut untuk periode 1872 sampai
1999, yaitu baris 3 sampai 130, dengan nama variabel di atas:
H- Hasil Dividen: DY (Ketik DY di sel H1 dan ketik rumus =C3/B3
di sel H3 dan salin ke bawah)
I-Capital Gain: CG (ketik CG di I1) ketik rumus =(B4-B3)/B3 di
I3 dan salin rumus tipe
J-Ináation:INF=(F4-F3)/F3 di J3 K-Real Return on equity:
RRE=H3+I3-J3 L- Tingkat Bunga Riil RIR=(E3/100)-J3.

Perhatikan bahwa ini adalah proporsi, misalnya angka seperti 0,05. Ini sesuai dengan 5%.
Mengapa kita mengurangi tingkat inflasi untuk mendapatkan pengembalian riil, sedangkan kita
akan membagi indeks harga saham dengan tingkat harga untuk mendapatkan indeks harga
saham riil? Mengapa kita membagi tingkat bunga dengan 100? Inasiasi plot. Perhatikan
bagaimana kita mencocokkan tanggal, misalnya dalam menentukan inflasi, kita harus
memperhitungkan fakta bahwa indeks harga adalah angka Januari.

8.3. Grafik Pengembalian Nyata pada Ekuitas

Kami sekarang ingin menganalisis pengembalian riil atas ekuitas (yaitu dividen ditambah keuntungan
modal dikurangi inflasi) selama periode 1872-1999 dan membandingkannya dengan tingkat bunga riil.
Pertama kita akan melakukannya secara grafis. Sorot K3:L130, klik wizard grafik, pilih grafik
garis dan lihat pengembalian riil dan tingkat bunga riil. Ada banyak volatilitas dari tahun ke tahun
di RRE dan kisarannya besar: dari sekitar -0,5 hingga +0,5.
Selama periode ini, Anda bisa saja membuat atau kehilangan hampir 50% dari investasi Anda di
tahun-tahun yang luar biasa. Tingkat bunga riil jauh lebih tidak stabil. Pergi ke sel J132 ketik
mean, lalu K132 dan ketik =AVERAGE(K3:K130). Pergi ke J 133 ketik SD, lalu K133 dan ketik
=STDEV(K3:K130). Salin dua sel ini

63
Machine Translated by Google

ke L132 dan 133. Anda sekarang memiliki mean (rata-rata) dan (estimasi tak bias
dari) standar deviasi untuk pengembalian riil atas ekuitas dan bunga riil
kecepatan. Rata-rata pengembalian riil atas ekuitas jauh lebih tinggi daripada dari bunga
kecepatan. Ini dikenal sebagai premi ekuitas. Tapi risiko pada ekuitas, diukur
dengan standar deviasi, juga jauh lebih tinggi. Hitung pengembalian riil rata-rata
pada ekuitas, 1872-1990 dan 1991-1999.

8.4. Statistik Deskriptif Lainnya

Kami ingin menghitung statistik deskriptif untuk larik K3:J130. Mengikuti


prinsip-prinsip di atas menyusun tabel berikut untuk RRE dan RIR. Hanya angka
untuk RRE diberikan di bawah ini.
garis JK 132 Mean = RATA- RRE
RATA(RR) 0,088
133 SD =STDEV(RR) 0,184
134 MIN=QUARTILE(k3:k130,0)
135 -0,448
25% =QUARTILE(k3:k130,1) -0,021
136 MEDIAN =QUARTILE(k3:k130,2) 0,091
137 75% =QUARTILE(k3:k130,3) 0,219
138 MAX 139 =QUARTILE(k3:k130,4) 0,514
SKEW = SKEW(k3:k130) -0,389
140 KURTOSIS =KURT(k3:k130) 0.296
Anda juga dapat menggunakan perintah statistik deskriptif dalam analisis data untuk mendapatkan
sebagian besar ini.

8.5. Interpretasi statistik ringkasan spreadsheet

Panggil seri yt ; t = 1; 2; :::; T: Di atas kita hitung meannya:

y=X yt=T
saya = 1

'sampel' standar deviasi yang tidak bias, SD:

(yt y) 2=(T 1)
s = vuutX T
saya = 1

Jumlah T 1 dikenal sebagai derajat kebebasan.

64
Machine Translated by Google

Kemudian kami menghitung nilai minimum; nilai yang 25% dari pengamatan terletak di
bawah; median, nilai yang 50% dari pengamatan terletak di bawah; nilai yang 75% dari
pengamatan terletak di bawah; dan maksimal. Ini dikenal sebagai Kuartil. Excel juga
memungkinkan Anda untuk menghitung persentil: nilai yang x% terletak di bawah, untuk
setiap x: Pengembalian negatif di lebih dari 25% tahun. Median sangat mirip dengan mean
yang menunjukkan bahwa distribusinya simetris. Kisaran pengembalian riil sangat besar,
antara minus 50% dan plus 50%.
Ukuran kemiringannya kira-kira
T 3
1 (yt- y)
n X
:

saya = 1
s

momen ketiga standar. Sebenarnya Excel membuat penyesuaian derajat kebebasan, mirip
dengan contoh standar deviasi di atas. Jika distribusinya simetris, ukuran kemiringan harus
nol. Dalam hal ini, itu cantik
mendekati nol.

Ukuran (kelebihan) kurtosis kira-kira


T 4
1 (yt- y)
3:
n X saya = 1
s

jika distribusinya normal, nilai harapan dari suku pertama (momen pusat standar keempat)
adalah tiga, jadi nilai di sekitar nol menunjukkan distribusi yang kurang lebih normal. Anda
bisa mendapatkan definisi yang tepat dari BANTUAN, FUNGSI STATISTIK, SKEW & KURT.

65
Machine Translated by Google

9. Nomor Indeks
9.1. pengantar

Ináation, tingkat pertumbuhan tingkat harga, diukur dengan persentase perubahan dalam
indeks harga:

INFt = 100 (Pt Pt1)=Pt1 = 100 f(Pt=Pt1) 1g 100 (ln Pt ln Pt1)

dimana Pt adalah indeks harga. Ada banyak indeks harga yang berbeda. Di masa lalu Bank of
England memiliki target inflasi di Indeks Harga Eceran tidak termasuk pembayaran bunga
hipotek (yang naik ketika suku bunga dinaikkan) RPIX 2,5%. Pada tahun 2004 ini digantikan
oleh target 2% untuk inflasi dalam Indeks Harga Konsumen, CPI. Ini sebelumnya dikenal
sebagai Indeks Harmonisasi Harga Konsumen HICP, jenis indeks yang digunakan Bank
Sentral Eropa. Ada dua perbedaan utama. Salah satunya adalah dalam metode konstruksi.
RPI menggunakan cara aritmatika, CPI menggunakan cara geometris. Perbedaan ini membuat
RPI berjalan sekitar 0,5% lebih tinggi, sehingga terjadi penurunan target dari 2,5% menjadi
2%. Yang lainnya adalah bahwa CPI tidak termasuk perumahan. Pada bulan Agustus 2003
RPIX adalah 2,9%, CPI 1,3%, sebagian besar perbedaan dicatat oleh tingginya tingkat inflasi
perumahan Inggris, sedangkan pada Mei 2009 CPI berada di +2,2% dan RPI di -1,1%,
deáation, tidak ináation, karena jatuhnya harga rumah. RPI dan CPI mengukur harga
konsumen, deáator PDB, indeks harga lain yang digunakan di bagian 7.7, mengukur harga
secara keseluruhan
ekonomi.
Bedakan antara tingkat harga dan tingkat inflasi. Ketika tingkat inflasi turun, tetapi masih
positif, harga masih naik, hanya pada tingkat yang lebih lambat. Jika inflasi negatif, harga
turun. Misalkan Indeks Harga adalah 157 pada tahun 1995 dan 163 pada tahun 1996, maka
laju inflasi adalah 3,82%. Perhatikan bahwa ini juga dapat dinyatakan sebagai proporsi, 0,0382.
Dalam banyak kasus, kita akan menghitung tingkat pertumbuhan dengan perubahan logaritma,
yang sangat dekat dengan perubahan proporsional untuk perubahan kecil, misalnya <0:1,
yaitu10%. Kami biasanya bekerja dengan log alami ke basis e, sering dilambangkan dengan
LN daripada LOG, kadang-kadang digunakan hanya untuk basis 10. Indeks harga secara
sewenang-wenang ditetapkan pada 100, atau 1, dalam beberapa tahun dasar, sehingga indeks
itu sendiri tidak dapat dibandingkan di seluruh negara. Indeks dapat digunakan untuk
membandingkan pertumbuhan relatif terhadap tahun dasar jika mereka semua memiliki tahun
dasar yang sama, misalnya 1990=100 untuk semua negara.
Jika tingkat inflasi naik dari 3% menjadi 6%, itu telah meningkat tiga poin persentase.
Belum naik tiga persen, malah naik 100%. Jika ada yang jatuh

66
Machine Translated by Google

sebesar 50% dan kemudian naik sebesar 50%, ia tidak kembali ke tempat awalnya. Jika Anda
mulai dari 100, itu akan turun menjadi 50, lalu naik 50% dari 50, 25, untuk mencapai 75.

9.2. Harga dan Kuantitas, Variabel Riil dan Nominal

Misalkan sebuah perusahaan membeli 2 juta barel minyak pada tahun 2003 dengan harga $35 per barel
, 2003
dan satu juta pada tahun 2004 dengan harga $40 per barel, kita dapat menyatakan harga pada tahun
sebagai Pt dan harga pada tahun 2004 sebagai Pt+1 keduanya diukur dalam dolar: Demikian pula
jumlahnya adalah Qt dan Qt+1, keduanya diukur dalam juta barel. Total pengeluaran untuk minyak
setiap tahun adalah Et = PtQt dan Et+1 = Pt+1Qt+1, keduanya diukur dalam jutaan dolar:

Pt Qt Et
t 35 2 70 t
+ 1 40 1 40
Perubahan pengeluaran dari $70 juta menjadi $40 juta, mencerminkan kenaikan harga sebesar
14,3% dan penurunan kuantitas sebesar 50%. Perhatikan bahwa kita hanya membutuhkan dua
dari tiga informasi dalam tabel untuk setiap tahun. Di atas mengetahui harga dan kuantitas kita
bisa menghitung pengeluaran. Jika kita mengetahui pengeluaran dan kuantitas, kita selalu dapat
menghitung harga sebagai Pt = Et=Qt : Jika kita mengetahui pengeluaran dan harga, kita dapat
menghitung kuantitas sebagai Qt = Et=Pt :
Seringkali kita bekerja dengan logaritma, di mana perubahan proporsional dalam
pengeluaran dapat didekomposisi menjadi jumlah perubahan proporsional dalam harga dan kuantitas

ln Et = ln Et ln Et1 = (ln Pt
+ ln Qt) (ln Pt1 + ln Qt1) = (ln Pt ln Pt1) +
(ln Qt ln Qt1) = ln Pt + ln Qt

Perhatikan bahwa rumus akan lebih rumit jika kita bekerja dengan nilai aslinya

Et = PtQt Pt1Qt1
= (Pt1 + Pt)(Qt1 + Qt) Pt1Qt1
= Pt1Qt1 + Pt1 Qt1 + Qt1 Pt1 + Pt1 Qt1 Pt1Qt1
= Pt1 Qt1 + Qt1 Pt1 + Pt1 Qt1:
Perubahan kuantitas yang diukur pada harga tahun lalu, ditambah perubahan harga
yang diukur pada kuantitas tahun lalu ditambah istilah interaksi. Cara termudah untuk

67
Machine Translated by Google

menyajikan ini pada grafik dengan harga dan kuantitas pada dua sumbu. Pendapatan adalah luas
persegi panjang, harga dikalikan kuantitas. Gambarlah dua persegi panjang untuk tahun t dan t 1:
Selisih antara luasnya akan terdiri dari tiga komponen persamaan akhir.

Sebagian besar waktu, kita tidak berurusan dengan satu barang, tetapi dengan agregat barang,
sehingga pengeluaran total adalah jumlah harga kali jumlah barang yang berbeda, i = 1; 2; :::; N yang
harga dan kuantitasnya berubah dari waktu ke waktu.

Et = Xn pitqit:
saya = 1

Ini seperti tanda terima supermarket Anda selama satu minggu, ini mencantumkan berapa banyak setiap
barang yang dibeli pada setiap harga dan total yang dibelanjakan. Untuk memberikan ukuran kuantitas, kami
mempertahankan harga konstan pada beberapa tahun dasar, 0; katakanlah 2000 dan kemudian kuantitas
atau ukuran harga konstan kami adalah

Qt = Xn pi0qit:
saya = 1

Seri moneter dapat berupa nominal (dalam harga saat ini, seperti pengeluaran) atau secara riil
(dalam harga konstan beberapa tahun dasar untuk mengoreksi inflasi, untuk mengukur kuantitas). Untuk
mengubah seri nominal menjadi seri nyata dibagi dengan indeks harga. Jadi jika kita sebut PDB nominal
Et dan PDB riil Qt , dan indeks harga Pt maka Et = PtQt : Jadi diberikan data PDB nominal (harga
berlaku) dan indeksPtharga kita
adalah dapat
nilai menghitung
indeks PDB
harga. Atau riilkita
jika (harga konstan)
memiliki datasebagai
tentang Qt
PDB= Yt= PTsaat
harga ; dimana
ini
(nominal) dan harga konstan (riil), kita dapat menghitung indeks harga (biasanya disebut deáator
implisit) sebagai rasio dari deret harga saat ini terhadap harga konstan: Pt = Yt=Qt :

Sebagian besar sumber statistik hanya memberikan dua dari tiga seri yang mungkin, nominal,
nyata, harga, dengan asumsi (agak tidak masuk akal) bahwa pengguna akan tahu cara menghitung
yang ketiga dari dua lainnya.

9.3. Indeks Harga

Misalkan kita ingin mengukur berapa harga suatu barang, i = 1; 2; :::; N telah pindah dari waktu ke
waktu, t = 0; 1; 2; :::; T; (misalnya 1990,1991,1992). Kami mengamati harga, lubang dan kuantitas, qit
setiap barang di setiap tahun. Total pengeluaran untuk semua barang

68
Machine Translated by Google

pada tahun t, misalnya PDB harga saat ini, adalah Et = PNi=1 pitqit: Kita juga dapat menyatakan ini
sebagai indeks, relatif terhadap nilainya dalam beberapa tahun dasar:

Et = Saya PNi=1 pitqit


PNi=1 pi0qi0
di sini indeksnya akan menjadi 1 pada tahun dasar, biasanya semuanya dikalikan dengan 100
untuk menjadikannya 100 pada tahun dasar. Jika basisnya 100, maka E 100 tmemberikan
persentase
Saya

perubahan antara tahun dasar dan tahun t. Nomor indeks adalah 'bebas satuan'. Ini adalah indeks
pengeluaran.
Serangkaian harga konstan akan mengukur kuantitas yang semuanya dievaluasi dalam harga
tahun dasar yang sama. Misalkan kita menggunakan tahun nol, maka ukuran harga konstan
kuantitas adalah
N

Qt = X pi0qit:
saya = 1

PDB harga konstan adalah ukuran dari bentuk ini, di mana tahun dasar diubah setiap lima tahun
atau lebih. Baru-baru ini pendekatan basis tetap ini telah diganti dengan basis bergerak yang
disebut ukuran pembobotan rantai.
Kita dapat membuat indeks harga sebagai rasio dari rangkaian pengeluaran terhadap
rangkaian harga konstan (dalam kasus PDB, ini akan disebut deáator PDB)

P t1 =
dll = PNi=1 pitqit :

Qt PNi=1 pi0qit
Ini mengukur harga di tahun t relatif terhadap harga di tahun nol, menggunakan jumlah di tahun t
1
sebagai bobot. Dimana t = 0, P = 1.
t Indeks selalu
Ini adalah sama
indeks dengan 1 (atau 100) pada tahun dasarnya.
harga.

Kita juga bisa menggunakan kuantitas di tahun nol sebagai bobot, dan ini akan memberikan
indeks harga yang berbeda.

P t2 = PNi=1 pitqi0 :

PNi=1 pi0qi0
Perhatikan bahwa ini akan memberikan ukuran yang berbeda dari perubahan harga selama
periode 0 sampai t. Khususnya, untuk barang-barang yang harganya naik (turun), kuantitas pada
tahun t cenderung lebih rendah (lebih tinggi) daripada di tahun 0. Indeks yang menggunakan nilai
awal periode sebagai bobot disebut indeks Laspeyres, indeks yang menggunakan akhir nilai
periode disebut indeks Paasche. Ada berbagai cara lain untuk menghitung indeks harga; indeks
rantai menggunakan bobot bergerak. Terlepas dari masalah

69
Machine Translated by Google

memilih formula yang tepat, ada juga masalah pengukuran; khususnya, mengukur jumlah
layanan yang disediakan, memperhitungkan perubahan kualitas dan pengenalan barang
baru. Barrow Bab 2 membahas nomor indeks.

Anda akan sering menemukan bahwa Anda memiliki data yang tumpang tindih. Misalnya,
satu edisi sumber Anda memberikan seri harga saat ini dan seri harga konstan pada harga
1980 untuk 1980 hingga 1990; yang kedua memberi Anda seri harga saat ini dan seri harga
konstan pada harga 1985 untuk 1985 hingga 1995. Ini menimbulkan dua masalah. Pertama,
seri harga saat ini mungkin telah direvisi. Gunakan data terbaru jika tersedia dan data
sebelumnya jika tidak tersedia. Kedua, Anda harus mengonversi data ke dasar harga umum.
Untuk mengonversinya, hitung rasio pada tahun 1985 (tahun paling awal dari sumber
selanjutnya) dari deret harga konstan 1985 ke deret harga konstan 1980; kemudian kalikan
seri harga 1980 sebelumnya dengan rasio ini untuk mengubah seri harga konstan 1980
menjadi harga konstan 1985. Jika dua perkiraan seri harga saat ini untuk tahun 1985 sangat
berbeda, Anda juga harus menyesuaikan rasio dari seri harga saat ini.

9.3.1. Contoh Substitusi

Pada tahun 2000 sebuah perusahaan membeli 10 komputer seharga £2000 masing-masing dan 20 lisensi perangkat lunak
seharga £1000 masing-masing. Pada tahun 2001 membeli 20 komputer di £ 1000 masing-masing dan 10 lisensi perangkat
lunak di £ 2000 masing-masing.

(a) Berapa total biaya komputasi di setiap tahun? (b) Berapa


total biaya komputasi setiap tahun (i) jika
membeli jumlah 2000 (ii) jika telah membeli jumlah 2001?
(c) Gunakan perkiraan dalam (b) untuk menghitung dua ukuran ináasi (i) menggunakan
2000 kuantitas sebagai bobot dan (ii) menggunakan kuantitas 2001 sebagai
bobot. (d) Komentari hasil Anda.
Jawaban
Contoh ini sedikit ekstrim untuk menunjukkan efek yang dapat ditimbulkan oleh substitusi
pada pengukuran inasi.
(a) Total pengeluaran adalah £40.000 di kedua tahun: 2000=(10 2000+20 1000);
2001=(20 1000 + 10 2000). (b) (i) Menggunakan 2000 kuantitas dan 2000 harga, pengeluaran
pada tahun 2000 akan menjadi £ 40.000, yang itu. Menggunakan jumlah 2000 dan harga
2001 pengeluaran pada tahun 2001 akan menjadi (10 1000 + 20 2000) = 50.000 (ii) Demikian
pula menggunakan jumlah tahun 2001, 2000 = 50.000 dan 2001 = 40.000

70
Machine Translated by Google

(c) Menggunakan 2000 kuantitas sebagai ináasi bobot adalah 25%=100(50,000/40,000-1),


menggunakan besaran 2001 sebagai ináasi bobot adalah 20% =100(40.000/50.000-1).
(d) Karena respons permintaan terhadap harga (perusahaan membeli lebih banyak perangkat
keras yang harganya turun dan lebih sedikit perangkat lunak yang harganya naik), ukuran
pembobotan dasar cenderung melebih-lebihkan inflasi (+25%) dan ukuran pembobotan terminal
cenderung meremehkannya (-20%). Kebenaran terletak di suatu tempat di antara keduanya.

9.3.2. Contoh Harga Rumah

Ada sejumlah indeks harga rumah yang berbeda, yang dapat menunjukkan tren yang sangat
berbeda. Perbedaan utama adalah tahap transaksi di mana mereka mengukur harga. Beberapa
mengukur harga rumah yang diminta di pasar.
Ini memberikan informasi awal, tetapi mereka mungkin menjual lebih atau kurang dari harga
permintaan awal. Seri Building Society didasarkan pada persetujuan hipotek, sekali lagi ini mungkin
tidak mencerminkan harga akhir dan sekitar 25% rumah dibayar tunai dan tidak termasuk dalam
seri ini karena pembeliannya tidak memerlukan hipotek.
Seri lainnya menggunakan survei penyelesaian (saat penjualan selesai). Angka Pendaftaran
Tanah didasarkan pada saat transaksi didaftarkan, dan mencakup harga akhir untuk semua
transaksi perumahan. Kesenjangan antara rumah yang dipasarkan dan transaksi yang didaftarkan
bisa lebih dari enam bulan. Indeks juga berbeda dalam (a) apakah mereka menyesuaikan untuk
campuran transaksi; di seri unadjusted harga rata-rata akan melonjak jika ada penjualan rumah
yang sangat mahal (b) seberapa sering mereka diterbitkan dan berapa lama waktu yang dibutuhkan
untuk mempublikasikan data (c) apakah mereka disesuaikan secara musiman. Harga rumah
biasanya dibandingkan dengan pendapatan rata-rata, dengan rasio Inggris abad ke-20 yang
normal sekitar 3,5. Pada abad ke-21 rasio naik lebih tinggi dari puncak sebelumnya, sebelum turun
kembali.

9.3.3. Contoh indeks pasar saham

Lihat bagian 8 untuk pengukuran pengembalian ekuitas menggunakan indeks Standard & Poors
(S&P). Di sini kita akan mempertimbangkan pengukuran pasar rata-rata
kembali.
Definisi yang paling jelas dari nilai pasar saham adalah nilai total semua saham
yang dikutip (jumlah atas perusahaan dari harga per saham dikalikan jumlah saham
yang dikeluarkan oleh perusahaan) PNnilai
Vit,Vit.
di mana terdapat N perusahaan, dengan
saya = 1

Ini diskalakan dengan nilai dalam beberapa tahun dasar untuk membangun sebuah indeks.
Beginilah cara S&P 500 dihitung. Pada ukuran ini antara t = 0;(31/3/00) dan

71
Machine Translated by Google

t = T;(31/7/03) indeks S&P turun 30,5%:

PNsaya = 1 ViT PN saya = 1 Vi0


R1 = = 0:305:
PN saya = 1 Vi0

Ukuran alternatifnya adalah dengan mengambil rata-rata pengembalian dari masing-masing


saham:
N
ViT Vi0
R2 = X ( )=N = 0:12:
saya = 1
Vi0

Selama periode yang sama ukuran ini menunjukkan peningkatan sebesar 12%. Ukuran ketiga,
menggunakan rata-rata geometrik menunjukkan penurunan sebesar 18% (New York Times 31/8/03 B6).
R2 adalah rata-rata tertimbang yang sama dari pengembalian saham individu, R1 ditimbang
berdasarkan ukurannya. Untuk melihat catatan ini bahwa
N
PN saya = 1 ViT
1 + R1 = =X
PN Vi0 PN Vi0
saya = 1 i=1 " ViO saya = 1 Vi0 # ViT

di mana istilah dalam [::] adalah bobot, pangsa pasar yang diperhitungkan oleh rm i, pada tahun
dasar. Dalam 1 + R2 masing-masing bobot hanya 1=N:
Sebagian besar indeks ditimbang berdasarkan kapitalisasi pasar, tetapi bentuk pembobotan
lainnya menjadi lebih luas, misalnya 'indeks fundamental', yang menggunakan ukuran seperti
pendapatan perusahaan.

9.3.4. Contoh kontrak senjata terkait Indeks

Kontrak pengadaan senjata sering kali mencakup jangka waktu yang lama, karena membutuhkan
waktu bertahun-tahun untuk dikembangkan dan diproduksi. EuroÖghter/Typhoon, yang baru
mulai beroperasi pada tahun 2004, dimulai pada awal 1980-an. Dalam kontrak seperti itu adalah
umum untuk menghubungkan harga yang disepakati dengan inflasi, masalahnya kemudian
menjadi indeks mana yang akan digunakan. Pada helikopter EH101, kontraktor utama, IBM pada
saat itu mengusulkan bahan sederhana dan indeks bahan bakar (pada dasarnya indeks harga output).
Kementerian Pertahanan Inggris bersikeras pada penggunaan indeks biaya gabungan yang
mencerminkan biaya input termasuk tenaga kerja. Karena pertumbuhan produktivitas, indeks harga
output tumbuh lebih lambat daripada indeks biaya input. Kantor Audit Nasional, dalam laporannya
Accounting for Ináation in Defence Procurement, paragraf 2.25, Desember 1993, menghitung
bahwa seandainya MOD menggunakan indeks yang disarankan oleh IBM, daripada yang diminta,
ia dapat menghemat £ 95 juta atau sekitar 6%

72
Machine Translated by Google

dari harga kontrak selama masa kontrak. Pengeluaran yang berlebihan ini hanya mendapat
sedikit publisitas karena sebagian besar jurnalis dan anggota parlemen cenderung tertidur
begitu nomor indeks disebutkan.
Untuk melihat hubungan antara harga dan upah, tuliskan nilai total penjualan (harga dikali
kuantitas) sebagai markup pada biaya tenaga kerja, upah dikalikan jumlah pekerja

PtQt = (1 + )WtEt

harga kemudian mark-up pada biaya tenaga kerja unit

Pt = (1 + )WtEt=Qt

dan mencatat bahwa produktivitas adalah output per pekerja Qt=Et

ln Pt = ln(1 + ) + ln Berat ln(Qt=Et)

jadi jika mark-up konstan, inflasi harga output adalah tingkat pertumbuhan upah dikurangi
tingkat pertumbuhan produktivitas:

ln Pt = ln Wt ln(Qt=Et)

73
Machine Translated by Google

10. Probabilitas
10.1. pengantar

Kita perlu menganalisis kasus di mana kita tidak tahu apa yang akan terjadi: di mana ada
risiko, keacakan, peluang, bahaya, pertaruhan, dll. Probabilitas menyediakan cara untuk
melakukan ini. Beberapa membedakan antara (a) risiko: masa depan tidak diketahui tetapi
Anda dapat menetapkan probabilitas ke set kemungkinan peristiwa yang mungkin terjadi; (b)
ketidakpastian: Anda mengetahui rangkaian kejadian yang mungkin tetapi tidak dapat
menetapkan probabilitasnya; dan (c) ketidaksadaran di mana Anda bahkan tidak dapat
menggambarkan rangkaian peristiwa yang mungkin terjadi, apa yang disebut oleh Menteri
Pertahanan AS Donald Rumsfeld sebagai hal yang tidak diketahui yang tidak diketahui, hal-hal
yang bahkan tidak Anda ketahui yang tidak Anda ketahui. Orang-orang tampaknya mengalami
kesulitan dengan probabilitas dan ini adalah cabang matematika yang relatif baru, Tampaknya
tidak ada yang menganggap probabilitas sebagai hal yang dapat dihitung sebelum sekitar
tahun 1650 (setelah kalkulus) dan landasan aksiomatik teori probabilitas hanya disediakan di
1930-an oleh Matematikawan Rusia Kolmogorov.
Probabilitas adalah angka antara nol dan satu, yang mewakili peluang suatu peristiwa
terjadi. Barrow bab 2 membahasnya. Jika suatu peristiwa pasti terjadi, itu memiliki probabilitas
satu; jika suatu peristiwa pasti tidak terjadi, itu memiliki probabilitas nol. Dikatakan bahwa
hanya kematian dan pajak yang pasti, yang lainnya tidak pasti. Probabilitas dapat mewakili
derajat keyakinan, atau didasarkan pada frekuensi relatif, proporsi waktu suatu peristiwa
terjadi. Jadi, jika dalam pacuan kuda sebelumnya, favorit (kuda dengan probabilitas tertinggi,
peluang terpendek yang ditawarkan oleh bandar taruhan) memenangkan seperempat waktu,
Anda dapat mengatakan kemungkinan kemenangan favorit adalah 0,25; ini adalah perkiraan
frekuensi relatif. Sebagai alternatif, Anda dapat melihat balapan tertentu di masa depan,
mempelajari sejarah (bentuk) kuda dan menebak probabilitas favorit dalam memenangkan
balapan, ini adalah perkiraan tingkat kepercayaan. Anda bertaruh pada favorit jika perkiraan
Anda tentang kemungkinan kemenangan favorit lebih besar dari perkiraan bandar, yang
dinyatakan dalam peluang yang ditawarkan; odds adalah rasio dari probabilitas ke satu
dikurangi probabilitas.
Ada banyak literatur tentang ekonomi dan statistik taruhan. Perhatikan bahwa meskipun
probabilitas dari kejadian yang mungkin harus berjumlah satu (pasti bahwa beberapa kuda
akan memenangkan perlombaan), probabilitas tersirat dalam peluang yang ditawarkan oleh
bandar tidak. Begitulah cara mereka menghasilkan uang rata-rata. Ada juga bias sistematis.
Misalnya, kemungkinan kemenangan favorit biasanya sedikit lebih baik daripada peluang
taruhan yang disarankan dan kemungkinan orang luar sedikit lebih buruk. Bias favorit-longshot
ini telah dicatat selama lebih dari 60

74
Machine Translated by Google

tahun dalam berbagai pacuan kuda, tetapi penjelasannya masih diperdebatkan.


Jika Anda melempar dadu (satu dadu kadang-kadang dikenal sebagai dadu) ada
enam kemungkinan hasil, 1 sampai 6, dan jika dadu itu adil, setiap hasil memiliki
peluang yang sama; jadi peluang munculnya bilangan tertentu adalah 1/6. Pada satu
lemparan Anda hanya bisa mendapatkan satu angka, jadi peluang mendapatkan 3
dan 4 pada satu lemparan adalah nol, itu tidak mungkin terjadi. Peristiwa yang tidak
dapat terjadi keduanya (di mana probabilitas keduanya terjadi adalah nol) dikatakan
saling lepas. Untuk kejadian yang saling lepas, peluang terjadinya satu atau yang lain
hanyalah jumlah dari peluangnya, jadi peluang terambilnya 3 atau 4 pada satu
pelemparan dadu adalah 1/6+1/6=2/6 =1/3.
Misalkan dua orang, katakanlah A dan B, masing-masing melempar dadu yang
mendapat angka B tidak tergantung pada angka yang didapat A. Hasil lemparan A tidak
mempengaruhi lemparan B. Probabilitas dua peristiwa independen yang terjadi adalah
produk dari probabilitas mereka. Jadi peluang A dan B mendapat 3 adalah 1=6 1=6 =
1=36. Ada 36 (62 ) hasil yang mungkin dan masing-masing kemungkinannya sama. 36
hasil ditunjukkan dalam kisi di bawah ini, dengan enam kasus di mana A dan B
mendapatkan skor yang sama ditunjukkan dalam huruf tebal. Jadi ada peluang 6=36 =
1=6 seri. Kita juga dapat menggunakan kisi-kisi untuk memperkirakan probabilitas A
mendapatkan skor lebih tinggi daripada B. Kejadian-kejadian ini sesuai dengan 15
kejadian di atas diagonal, sehingga probabilitas A menang adalah 15=36 = 5=12;
probabilitas B menang juga 5=12 dan probabilitas mereka mendapatkan skor yang sama,
adalah 1=6 = 2=12: Perhatikan 3 peristiwa (A menang, B menang, seri) saling eksklusif
dan jumlah probabilitasnya ke satu, 12 = 12.
SEBUAH

1234561
xxxxxx
2 xxxxxx
B 3 xxxxxx 4 xxxxxx 5
xxxxxx 6 xxxxxx

Ketika peristiwa tidak saling eksklusif, kita harus memperhitungkan kemungkinan kedua
peristiwa itu terjadi. Hal ini tampaknya pertama kali ditunjukkan oleh Bernouili dalam
karyanya Ars cojectandi pada tahun 1713, dengan contoh yang mengerikan. “Jika dua
orang yang dijatuhi hukuman mati diperintahkan untuk melempar dadu dengan syarat siapa
yang mendapat jumlah poin lebih sedikit akan dieksekusi, sedangkan yang mendapat lebih
banyak akan dibebaskan, dan keduanya akan dibebaskan jika jumlah poinnya banyak. adalah sama,

75
Machine Translated by Google

kami menemukan bahwa harapan salah satunya adalah 7/12. Itu tidak berarti bahwa yang lain memiliki
harapan 5/12, karena jelas masing-masing memiliki peluang yang sama, sehingga orang kedua memiliki
harapan 7/12, yang akan memberi mereka berdua harapan 7 /6 kehidupan, yaitu lebih dari seluruh
kehidupan. Alasannya adalah karena tidak ada hasil sehingga setidaknya salah satunya tidak terhindar,
sementara ada beberapa yang keduanya terhindar."1 A akan menang 5=12 kali, seri 2=12 kali, jadi
bertahan 7=12 Demikian pula untuk B. Probabilitas setidaknya satu yang selamat adalah jumlah dari
probabilitas masing-masing yang selamat dikurangi probabilitas keduanya bertahan: 5=6+5=61=6 = 1.
Probabilitas keduanya harus dikurangkan ke hentikan penghitungan ganda Periksa apakah peluang
terambilnya 3 atau 4 pada dua pelemparan dadu adalah 1=3 + 1=3 1=9 = 20=36: Perhatikan bahwa ini
berbeda dengan peluang terambilnya salah satu a 3 atau a 4 pada kedua pelemparan dadu, yaitu
(1=3)2 = 1=9: Anda harus berhati-hati tentang bagaimana tepatnya kejadian probabilitas

dijelaskan.

10.2. Beberapa peraturan

Nyatakan peluang kejadian A terjadi sebagai P(A): Maka peluang kejadian A tidak terjadi adalah 1P(A):
Ini disebut komplemen dari A, kadang ditulis A. Jika kejadian A pasti terjadi P(A) = 1: Jika peristiwa A
tidak dapat terjadi P(A) = 0: Nyatakan kedua peristiwa A DAN B terjadi sebagai P(A \ B) (perpotongan);
ini sering dikenal sebagai probabilitas bersama. Jika kejadian saling lepas tidak dapat terjadi bersama-
sama maka P(A\B) = 0: Nyatakan peluang kejadian A ATAU kejadian B terjadi sebagai P(A [ B)
(serikat). Kemudian seperti yang kita lihat di atas dengan dadu:

P(A [ B) = P(A) + P(B) P(A \ B): Probabilitas A


atau B sama dengan probabilitas A ditambah probabilitas B dikurangi probabilitas A dan B terjadi.
Perhatikan bahwa jika kejadiannya saling lepas, P(A \ B) = 0 maka P(A [ B) = P(A) + P(B): Jika
kejadiannya bebas, peluang gabungan, yaitu peluang keduanya terjadi ; adalah

P(A \ B) = P(A) P(B):

Peluang terjadinya A jika peristiwa B telah terjadi disebut a


probabilitas bersyarat dan diberikan oleh:

P(A \ B)
P(Aj B) = :
(10.1)
P(B)

1Dikutip oleh Ian Hacking, Munculnya kemungkinan, hal144.

76
Machine Translated by Google

Di bawah ini kami akan menghitung probabilitas memenangkan jackpot dalam lotere.
Sebenarnya ini adalah probabilitas bersyarat: probabilitas kejadian A (memenangkan
jackpot), mengingat kejadian B (membeli tiket lotre). Memenangkan jackpot dan tidak
membeli tiket adalah peristiwa yang saling eksklusif. Probabilitas bersyarat memainkan
peran yang sangat penting dalam pengambilan keputusan. Mereka memberitahu Anda
bagaimana informasi bahwa B terjadi mengubah perkiraan Anda tentang kemungkinan
terjadinya A. Jika A dan B saling bebas P(A j B) = P(A); mengetahui bahwa B terjadi tidak
mengubah peluang terjadinya A: Demikian pula, peluang terjadinya B jika A terjadi adalah:

P(A \ B)
P(Bj A) = :
(10.2)
P(A)
Kalikan kedua sisi (10.1) dengan P(B) dan kedua sisi (10.2) dengan P(A); dan atur
ulang untuk memberi

P(A \ B) = P(A j B)P(B) = P(Bj A)P(A)

probabilitas gabungan adalah produk dari probabilitas bersyarat dan probabilitas marjinal
dalam setiap kasus. Menggunakan dua hubungan sisi kanan memberikan Teorema
Bayes:
P(Bj A)P(A)
P(Aj B) = :

P(B)
Rumus ini banyak digunakan untuk memperbarui probabilitas suatu kejadian A, dengan
adanya informasi baru, B: Dalam konteks ini P(A) disebut probabilitas sebelumnya dari
A, P(Bj A) disebut kemungkinan, dan P (Aj B) disebut peluang posterior.

10.2.1. Contoh: Pemutaran

Ada kontroversi yang cukup besar tentang nilai skrining untuk penyakit seperti kanker
payudara, kanker prostat atau HIV. Ini adalah kasus di mana penyakitnya tidak terlihat
tetapi dapat diungkapkan dengan tes, yang mungkin tidak selalu memberikan jawaban
yang benar. Sebut D mengidap penyakit, N tidak mengidap penyakit. Sebut TP tes yang
menunjukkan positif (menunjukkan bahwa Anda memiliki penyakit), TN tes yang
menunjukkan negatif (menunjukkan bahwa Anda tidak memiliki penyakit). Dalam
terminologi medis, probabilitas tes menunjukkan positif mengingat Anda menderita
penyakit P(TP j D) disebut sensitivitas tes. Probabilitas tes menunjukkan negatif jika Anda
tidak menderita penyakit P(TNj N) disebut spesifisitas tes. Keduanya sekitar 0,9 untuk
mamogram untuk kanker payudara, dan semakin tinggi semakin baik. Probabilitas
pengujian positif ketika Anda tidak memiliki

77
Machine Translated by Google

penyakit P(TP j N) = 1 P(TN j N) disebut peluang positif palsu.


Probabilitas pengujian negatif ketika Anda memiliki penyakit, P(TN j D) = 1 P(TP j D) adalah
probabilitas negatif palsu. Fakta bahwa keputusan dapat menyebabkan dua jenis kesalahan,
positif palsu dan negatif palsu dalam kasus ini, muncul di bawah berbagai nama yang berbeda
di banyak bidang.
Pertanyaan
Misalkan ada penyakit yang 1% populasinya menderita P(D) = 0:01: Ada tes yang 99%
akurat, yaitu 99% tes penyakit positif dan 99% tes tanpa tes penyakit negatif: P(TP j D) = P(TN j
N) = 0:99: Misalkan Anda tes positif, berapa probabilitas Anda benar-benar menderita penyakit?

Jawaban
Seringkali lebih sederhana dan lebih jelas untuk bekerja dengan angka daripada probabilitas
dan menyajikan hasilnya sebagai angka. Ini juga sering lebih berguna untuk audiens non-
spesialis. Bayangkan populasi seratus ribu: 100.000. Maka seribu (1000 = 0:01 100; 000) sakit
dan 99.000 sehat. Dari mereka yang mengidap penyakit tersebut, 990 (0:99 1000) hasil tes
positif, 10 tes negatif. Dari mereka yang tidak memiliki penyakit, 990 (0:01 99; 000) juga dites
positif, 98010 tes negatif.
Dari 2.990 = 1980 orang yang dites positif, separuhnya mengidap penyakit itu, jadi kemungkinan
mengidap penyakit itu jika Anda dites positif adalah 50%. Dengan demikian Anda tidak perlu
terlalu khawatir tentang hasil yang positif. Hasil negatif meyakinkan karena hanya 10 dari 98020,
yang dites negatif memiliki penyakit. Hasil positif biasanya ditindaklanjuti dengan tes lain, biopsi,
dll.
Kita bisa mewakili frekuensi bersama dan marginal sebagai tabel.
DNTP 990
990 1,980 TN 10 98.010 98020
1,000 99,000 100,000 Kita juga
bisa menghitung
probabilitas bersyarat
secara langsung menggunakan Bayes The
orem

P(TP j D)P(D) 0:99 0:01


P(Dj TP) = = = 0:5
P(TP) 0:99 0:01 + 0:01 0:99

Dalam prakteknya penyaringan dibatasi pada kelompok di mana P(D) tinggi untuk menghindari
masalah ini. Keputusan untuk menetapkan program skrining tergantung pada penilaian
keseimbangan antara (a) manfaat mendeteksi penyakit, misalnya apakah pengobatan dini
menyelamatkan nyawa, (b) biaya positif palsu: pengobatan yang tidak tepat, kekhawatiran

78
Machine Translated by Google

dll. dan (c) biaya pengujian, misalnya waktu istirahat untuk mengerjakan ujian. Karena
orang tidak setuju tentang biaya dan manfaat ini, penyaringan menjadi kontroversial.
Misalnya, ada tes untuk indikator kanker prostat, PSA. Asosiasi Medis Inggris mengatakan
"dua pertiga pria dengan PSA tinggi tidak menderita kanker prostat, beberapa pria dengan
kanker prostat tidak memiliki PSA tinggi dan tidak ada bukti yang menunjukkan apakah
mengobati kanker prostat lokal lebih berbahaya daripada baik". Ada industri swasta yang
menguntungkan dalam tes penyaringan.

10.2.2. Contoh Inovasi

Misalkan ada survei 1; 000 rms. Dari 500 laporan memperkenalkan produk baru di tahun
sebelumnya, 400 laporan memperkenalkan proses produksi baru dan 350 laporan
memperkenalkan produk baru dan proses baru. (a) Berapa probabilitas bahwa suatu
perusahaan tidak melakukan inovasi: tidak memperkenalkan produk baru maupun
proses baru? (b) Apakah probabilitas memperkenalkan produk baru dan proses baru
independen? (c) Berapa probabilitas bersyarat untuk memperkenalkan produk baru
yang diberikan?

bahwa perusahaan memperkenalkan proses baru?


(d) Berapa probabilitas bersyarat untuk memperkenalkan proses baru jika
perusahaan memperkenalkan produk baru?
Jawaban
(a) Ada 550 inovator: 350 melakukan keduanya, 150 hanya produk, 50 hanya proses.
Jadi 450 tidak berinovasi sehingga peluang untuk tidak berinovasi adalah 0:45: Secara
formal jika kejadian A; melakukan inovasi produk, P(A) = 0:5; peristiwa B; melakukan
inovasi proses, P(B) = 0:4: dan peluang melakukan keduanya, P(A \ B) = 0:35: Untuk
kejadian tidak melakukan inovasi, P(N)

P(N) = 1 P(A [ B)
= 1 (P(A) + P(B) P(A \ B)) 0:45 = 1 (0:5
+ 0:4 0:35):

Perhatikan kategori inovator, 550; dan non-inovator 450 saling eksklusif, probabilitas
menjadi inovator dan non-inovator adalah nol menurut definisi.

(b) Jika mereka independen produk dari probabilitas inovasi produk kali probabilitas
inovasi proses akan memberikan probabilitas melakukan keduanya: P(A)P(B) = P(A \ B).
Dalam hal ini 0:5 0:4 = 0:2 yang banyak

79
Machine Translated by Google

kurang dari 0:35, jadi mereka tidak independen. Anda lebih mungkin untuk melakukan jenis
inovasi kedua jika Anda telah melakukan satu jenis.
(c) Peluang melakukan inovasi produk tergantung pada inovasi proses adalah peluang
melakukan keduanya dibagi dengan peluang melakukan proses

P(A \ B) 0:35
P(Aj B) = = = 0:875
P(B) 0:4

87,5% inovator proses juga memperkenalkan produk baru.


(d) Probabilitas melakukan proses dengan syarat melakukan produk adalah prob
kemampuan melakukan keduanya dibagi dengan probabilitas melakukan produk:

P(A \ B) 0:35
P(Bj A) = = = 0:7
P(A) 0:5

70% inovator produk juga memperkenalkan proses baru. Perhatikan bahwa jawaban untuk (c)
dan (d) berbeda.

10.2.3. Contoh Latar Belakang: Hit and Run

Dua perusahaan taksi beroperasi di sebuah kota, 85% berwarna hijau, 15% berwarna biru.
Sebuah taksi menabrak pejalan kaki di malam hari dan melaju pergi. Orang yang tertabrak
mengatakan mereka mengira taksi itu berwarna biru. Tes selanjutnya menunjukkan bahwa
orang tersebut dapat mengidentifikasi warna taksi dengan benar di malam hari sebanyak 80%.
Berapa peluang orang tersebut tertabrak taksi biru?
Menjawab.
Kita tahu proporsi taksi B biru dan G hijau adalah P(B) = 0:15; P(G) =
0:85: Kita tahu bahwa probabilitas orang yang melaporkan bahwa itu adalah biru RB jika
berwarna biru adalah P(RB j B) = 0:8 dan dari ini probabilitas salah melaporkan bahwa itu adalah
biru P(RB j G) = 0:2: Yang perlu kita ketahui adalah probabilitas bahwa itu berwarna biru karena
mereka melaporkannya berwarna biru P(B j RB): Probabilitas orang yang melaporkan taksi biru
adalah probabilitas mereka melihat warna biru taksi dikalikan peluang melaporkannya sebagai
biru ditambah peluang melihat taksi hijau dikalikan peluang salah melaporkan taksi sebagai biru:

P(RB) = P (B) P(RB j B)+P (G) P(RB j G) = 0:15 0:8+0:85 0:2 = 0:29:
Kami memiliki semua persyaratan yang diperlukan untuk menerapkan Teorema Bayes

P(RB j B) P(B) 0:8 0:15 =


P(Bj RB) = = 0:41
P(RB) 0:29

80
Machine Translated by Google

Laporan bahwa taksi tersebut berwarna biru meningkatkan kemungkinan bahwa taksi tersebut
berwarna biru dari probabilitas sebelumnya tanpa syarat sebesar 0:15 menjadi probabilitas
posterior bersyarat sebesar 0:41; tapi masih jauh kurang dari 0:8:
Dalam hal ini kami mengetahui probabilitas sebelumnya, proporsi taksi biru dan hijau, yang
kami gunakan untuk menyesuaikan laporan. Dalam kasus lain di mana orang melaporkan
peristiwa, kami tidak mengetahui probabilitas sebelumnya, misalnya ketika 15% orang di
California melaporkan telah diculik oleh alien.

10.2.4. Contoh Latar Belakang: Bom H yang hilang

Pada tahun 1966 sebuah B52 jatuh dengan tanker udara saat mengisi bahan bakar di 30.000
kaki di lepas pantai Palomares Spanyol, kehilangan empat bom H-nya. Tiga ditemukan dengan
cepat, yang keempat ada di suatu tempat di dasar laut. Angkatan Laut AS membuat peta dasar
laut, kemudian meminta sekelompok ahli yang berbeda untuk bertaruh pada skenario yang
berbeda yang mungkin terjadi, (misalnya bom memiliki dua parasut, skenarionya mungkin (i)
keduanya terbuka, (ii) satu dibuka, (iii) tidak ada yang dibuka). Setiap skenario meninggalkan
senjata di lokasi yang berbeda. Mereka kemudian menggunakan teorema Bayes untuk
menggabungkan para ahli perkiraan subjektif yang berbeda dari probabilitas (berasal dari
taruhan) untuk menentukan probabilitas (posterior) bom berada di setiap lokasi. Lokasi
probabilitas tertinggi jauh dari tempat ditemukannya tiga bom lainnya atau puing-puing B52.
Untungnya bom itu ada di sana. Detailnya ada di Blind Manís Bu§ S. Sontag and C. Drew,
Harper Paperbacks, 1999, yang memberikan berbagai contoh lain penggunaan teorema Bayes
dalam peperangan kapal selam.

11. Variabel Acak Diskrit


Di atas kita berurusan dengan peristiwa di mana hasilnya tidak pasti, sekarang kita ingin
mempertimbangkan bagaimana kita menerapkan probabilitas pada variabel di mana kita tidak
yakin nilai apa yang akan mereka ambil. Ini disebut variabel acak. Peramalan melibatkan
memperkirakan nilai masa depan dari variabel acak dan harus memberikan tidak hanya
perkiraan perkiraan pusat inflasi CPI kami dalam dua tahun adalah 2,0%î, tetapi juga indikasi
kemungkinan ketidakpastian dan kami 90% yakin bahwa itu akan berada di antara 1,0% dan
3,0%î. Ináation adalah variabel acak kontinu, dapat mengambil nilai apa pun. Kita akan mulai
dengan variabel acak diskrit. Barrow membahas variabel acak di awal bab 3.

Sebuah variabel acak diskrit, X dapat mengambil sejumlah nilai yang mungkin
disebut say x1;berbeda,
x2; ::; xN : dengan probabilitas p1; hal2; :::; pN : Nilai yang diamati

81
Machine Translated by Google

realisasi dari variabel acak. Misalnya, X total yang diperoleh dari pelemparan dua dadu adalah
variabel acak diskrit. Ini dapat mengambil nilai 2 hingga 12.
Setelah Anda melempar dadu, Anda mengamati hasilnya, realisasinya, angka tertentu, xi .
Terkait dengan variabel acak adalah distribusi probabilitas, pi = f(xi); yang memberikan
probabilitas untuk memperoleh setiap kemungkinan hasil yang dapat diambil oleh variabel acak.
Distribusi probabilitas kumulatif,
j

F(xj ) = X f(xi) = P(X xj )


saya = 1

memberikan probabilitas mendapatkan nilai kurang dari atau sama dengan xj : Jadi dalam dadu
kasus:
xi f(xi) F(xj ) 1
0 0
2 1=36 1=36 3
2=36 3=36 4 3=36
6=36 5 4=36
10=36 6 5=36
15=36 7 6=36
21=36 8 5=36
26=36 9 4=36
30=36 10 3=36
33=36 11 2=36
35=36 12 1=36
36=36 Pastikan
Anda dapat menghitung semua probabilitas, gunakan kisi 6x6 di bagian 10.1 jika perlu.
Perhatikan f(1) = 0; tidak mungkin mendapatkan 1; dan F (12) = 1; Anda pasti mendapatkan
nilai yang kurang dari atau sama dengan 12. f(7) = 6=36, karena ada enam cara berbeda untuk
mendapatkan 7: (1,6), (6,1), (2 ,5), (5,2), (3,4), (4,3). Ini adalah elemen diagonal (berjalan dari
kiri bawah ke kanan atas) dalam kisi di atas di bagian 10.1. Pf(xi) = 1: Ini selalu benar untuk
distribusi probabilitas.
Distribusi probabilitas ini simetris dengan mean=median=mode=7.
Ekspektasi matematis atau nilai ekspektasi dari variabel acak (sering dilambangkan dengan
huruf Yunani mu) adalah jumlah dari setiap nilai yang dapat diambil, xi ; dikalikan dengan
peluang
mengambil nilai tersebut pi = f(xi) :
N

E(X) = X f(xi)xi =
:
(11.1)
saya = 1

82
Machine Translated by Google

Nilai yang diharapkan dari skor dari dua lemparan dadu adalah tujuh; dihitung sebagai
1 2 1
7=2 +3 +4 3 ::::: + 12 :

36 36 36 36

Jika semua nilai memiliki kemungkinan yang sama, f(xi) = 1=N, maka nilai yang diharapkan
adalah mean aritmatika.
Varians dari variabel acak didefinisikan sebagai
N
2 2
V (X) = E(XE(X))2 = X f(xi)(xi ) = :
(11.2)
saya = 1

Jika f(xi) = 1=N ini sama saja dengan varians populasi yang kita temui dalam statistik deskriptif,
bagian 6.1.2: Ini adalah rumus yang sama yang kita gunakan di bagian 6.2 dengan f(xi) = pi :
Dalam contoh dadu, variansnya adalah 5,8 dan standar deviasinya 2,4.

Misalkan ada dua variabel acak X dan Y dengan probabilitas individu (marginal) f(xi) dan
f(yi) dan probabilitas gabungan f(xi ; yi): Probabilitas gabungan menunjukkan probabilitas kedua
X mengambil nilai tertentu , xi dan Y mengambil nilai tertentu, yi ; dan sesuai dengan P(A \ ;B) di
atas. Jadi jika X adalah angka pada dadu pertama dan Y adalah angka pada dadu kedua

f(6; 6) = P(X = 6 \ Y = 6) = 1=36

Jika variabel acak independen, maka probabilitas gabungan hanyalah produk dari probabilitas
individu seperti yang kita lihat di atas

f(xi ; yi) = f(xi)f(yi)

dan jika mereka independen, nilai yang diharapkan dari produk adalah produk dari nilai yang
diharapkan
E(XY ) = E(X)E(Y ):
1
Nilai yang diharapkan berperilaku P: Jadi jika a adalah konstanta E(a) = a: Jika a dan b adalah
seperti konstanta N E(a + bxi) = a + bE(xi):
Kovarians antara dua variabel acak adalah

Cov(X; Y ) = E[(XE(X))(YE(Y ))]:

Jika f(xi) = 1=N ini adalah


N
1
Cov(X; Y ) =
N X (xi x)(yi y):
saya = 1

83
Machine Translated by Google

seperti yang kita lihat di bagian 6.1.3. Jika variabel acak independen maka kovariansnya adalah
nol. Namun, kovarians nol tidak berarti bahwa mereka independen, independensi adalah properti
yang lebih kuat.

11.0.5. Contoh Latar Belakang Lotere

Dalam lotere enam nomor dipilih secara acak dari 49 nomor yang mungkin. Dalam jangka
panjang, nilai yang diharapkan dari bermain lotre adalah 55p : Anda membayar mereka £1 dan
mereka membayar 45p hadiah untuk setiap pound yang mereka ambil. 55p yang Anda hilangkan,
rata-rata, dikenakan pajak, tujuan baik dan mereka biaya dan keuntungan. Anda memenangkan
jackpot jika Anda mencocokkan semua enam angka, meskipun tidak harus dalam urutan yang ditarik.
Urutkan bilangan dari yang terkecil sampai yang terbesar. Untuk nomor pertama yang Anda pilih
ada enam peluang untuk mendapatkannya (enam seri). Jadi peluang munculnya angka pertama
Anda adalah 6=49: Untuk mendapatkan angka kedua Anda, Anda hanya memiliki lima peluang
(angka pertama Anda telah ditarik meninggalkan 48 angka yang tersisa), jadi 5=48: Demikian
pula yang ketiga adalah 4 =47; keempat adalah 3=46; ke lima adalah 2=45; keenam adalah
1=44: Probabilitas mendapatkan semua 6 adalah produk dari probabilitas ini

6 5 4 3 2 1 720
=
49 48 47 46 45 44 10068347520

ini adalah 1 dari 13; 983; 816 kesempatan, 1 dari 14 juta. Perhatikan bahwa kejadian dengan
probabilitas rendah tidak selalu langka, itu tergantung pada populasi yang terpapar. Memenangkan
jackpot adalah peristiwa probabilitas rendah untuk orang tertentu, tetapi itu terjadi pada
seseorang hampir setiap minggu. Selalu periksa cakrawala waktu di mana probabilitas berlaku.
Seseorang yang berteriak kita semua akan matiî tidak terlalu mengkhawatirkan, karena itu
memang benar pada akhirnya, meskipun jika itu berarti dalam lima menit berikutnya, itu mungkin
lebih mengkhawatirkan.
Rumus umum untuk menghitung lotere adalah banyaknya cara di mana sekelompok r objek
(dalam hal ini 6) dapat dipilih dari sekelompok n objek yang lebih besar (dalam hal ini 49) di
mana urutan pemilihan tidak penting. Ini hanya kebalikan dari rumus di atas.

n! 49 48 47 46 45 44
nCr = r!(nr)! =
654321

Nilai yang diharapkan dari setiap permainan tertentu tergantung pada apakah jackpot telah
ditingkatkan dengan berguling dari permainan sebelumnya yang tidak dimenangkan. Bahkan
jika jackpot lebih dari £ 14m, nilai yang diharapkan mungkin tidak positif,

84
Machine Translated by Google

karena Anda mungkin harus berbagi jackpot dengan pemenang lain yang memilih nomor
yang sama, (kecuali jika Anda adalah anggota geng yang membeli semua tiket yang tersedia
dan memastikan tidak ada orang lain yang dapat membeli tiket apa pun). Memilih nomor
yang tidak populer, yang tidak akan dipilih orang lain, tidak akan mengubah kemungkinan
menang tetapi dapat meningkatkan kemungkinan tidak harus berbagi jackpot. Misalnya,
orang terkadang menggunakan tanggal lahir untuk memilih angka, jadi jangan memilih angka
di atas 31. Anda dapat memilih untuk membeli angka acak untuk menghindari masalah ini.
Desain lotere yang optimal menimbulkan pertanyaan ekonomi yang menarik.

11.0.6. Contoh Latar Belakang: churn

Rata-rata seorang pelanggan bernilai £20 sebulan untuk sebuah perusahaan telepon
seluler. Tetapi tingkat churn (probabilitas pelanggan berhenti berlangganan) adalah 5% per bulan.
Tingkat diskonto perusahaan adalah 2% per bulan. Perusahaan ingin tahu berapa
banyak yang dapat disubsidi handset, sambil menjaga nilai pelanggan tetap positif.
Apa nilai pelanggan bagi perusahaan?
Answer
Call nilai per bulan V; tingkat churn p; dan tingkat diskonto r: Setiap bulan proporsi
(1 p) berlanjut ke bulan berikutnya. Nilai sekarang adalah
t t
V (1 p) (1 hal)
PV = X1 = VX1
t=0 (1 + r) t t=0 (1 + r)
1
=V1 (1 p)
(1 + r)
1
1+r (1 p) 1
=V
+r

= (1 + r)V
r+p

karena ini hanyalah jumlah dari deret geometri dalam (1 p)=(1 + r): Pada angka-angka
ini
1:02 20
PV = = 291
0:07
pelanggan bernilai £ 291.

85
Machine Translated by Google

12. Variabel acak kontinu

Sedangkan variabel acak diskrit hanya dapat mengambil nilai tertentu, variabel
acak kontinu (misalnya inasi) dapat mengambil jumlah nilai yang tak terbatas.
Sesuai dengan probabilitas f(xi) untuk variabel acak diskrit terdapat fungsi densitas
kemampuan probabilitas, pdf; juga dilambangkan f(xi) untuk variabel acak kontinu
dan fungsi distribusi F(xi) = Pr(X xi) yang memberikan probabilitas bahwa variabel
acak akan mengambil nilai kurang dari atau sama dengan nilai yang ditentukan
xi : Bank of England menerbitkan perkiraan fungsi kepadatan probabilitas untuk
ináation sebagai bagan penggemar. Karena ada tak hingga banyaknya titik pada
garis nyata, probabilitas salah satu dari titik tersebut adalah nol, meskipun pdf
akan didefinisikan untuknya. Tetapi kita selalu dapat menghitung probabilitas jatuh
ke dalam interval tertentu, misalnya bahwa inflasi akan jatuh ke dalam kisaran
1,5% hingga 2,5%. Dalam definisi nilai harapan dan varians untuk variabel acak
kontinu, kami mengganti tanda penjumlahan pada (11:1) dan (11:2) untuk kasus diskrit dengan integra
jadi

E(X) = Z xf(x)dx =
2 2
) f(x)dx = :

V (X) = Z (x

12.1. Distribusi Seragam

Distribusi kontinu yang paling sederhana adalah seragam jangkauan. Rerata


variabel acak beraturan, E(x) = (a+b)=2 dan variansnya adalah V ar(x) = (ba)
2=12: Jadi jika rentangnya adalah a = 0 hingga b = 1 E (x) = 0:5; V ar(x) = 1=12;
dan simpangan baku x adalah 0,29. Perhatikan dalam kasus ini f(x) = 1 pada
rentang x, tetapi jumlah probabilitas ke kesatuan R f(x)dx = 1; karena grafik f(x):
memiliki tinggi 1; dan panjang 1; jadi area 1: Distribusi seragam digunakan di
bagian 14.

12.2. distribusi normal


Distribusi yang paling umum diasumsikan untuk variabel acak kontinu adalah
distribusi normal atau Gaussian. Ini memiliki bentuk lonceng. Salah satu sumber
kenormalan berasal dari teorema limit pusat. Ini mengatakan bahwa distribusi

86
Machine Translated by Google

rata-rata sampel akan mendekati normal, apa pun distribusi variabel asli dan bahwa pendekatan
ke normalitas ini akan menjadi lebih baik semakin besar
ukuran sampel. Distribusi normal sepenuhnya didefinisikan oleh mean (pertama
momen) dan varians (momen kedua), memiliki koefisien skewness (ketiga
momen) nol dan koefisien kurtosis (momen keempat) tiga. Itu
standar deviasi adalah akar kuadrat dari varians. Untuk distribusi normal
kira-kira dua pertiga dari pengamatan berada dalam satu standar deviasi dari
rata-rata dan 95% terletak dalam dua standar deviasi dari rata-rata.
Banyak variabel ekonomi, misalnya pendapatan atau ukuran perusahaan, tidak terdistribusi secara normal
tetapi sangat miring dan tidak simetris. Namun, logaritma dari variabel
sering kira-kira normal. Ini adalah alasan lain kita sering bekerja dengan logaritma dari
variabel dalam ilmu ekonomi.
Misalkan kita memiliki variabel acak Y yang berdistribusi normal dengan
nilai harapan E(Y ) = dan varians

V (Y ) = E(YE(Y ))2 = E(Y )


2 = 2

2
Kami menulis ini YN( ; ): Jika kami memiliki sampel independen dari distribusi N ini, kami
2
tion, Yi ; saya = 1; menulis ini Yi IN( ; ): Ini dikatakan Yi independen
2
2; :::; normal dengan nilai yang diharapkan dan varians : Meskipun nilai yang diharapkan dari a
distribusi normal sering dilambangkan yang kita gunakan
; untuk membuat hubungan dengan regresi
di bawah.
dan varians 2 . Kemudian
Jika salah satu variabel Y berdistribusi normal dengan mean ;

setiap fungsi linier dari Y juga terdistribusi normal.


YN 2
;

X = a + oleh N a + b ; b2 2

itu b 2
karena varians adalah konsep kuadrat, X memiliki standar deviasi
b . Jadi jika suhu lebih dari setahun diukur dalam celcius terdistribusi normal,
suhu di Farenheit (yang merupakan transformasi linier) juga normal.
Dengan menggunakan ini kita dapat menulis

Yi = + ui
2
, dannilai
= Yi variabel acak menjadi dariyang
aturan
diharapkan
ui N (0; didan
mana ui ): Menguraikan yang diamati
kesalahan, ui ; sangat nyaman untuk

banyak tujuan.
Fungsi linier penting dari Y adalah

Yi
zi = N(0; 1)

87
Machine Translated by Google

Ini disebut normal standar, memiliki nilai harapan nol dan varians (dan standar deviasi) satu
(seperti variabel standar lainnya) dan ditabulasikan di sebagian besar buku statistik dan
ekonometrika. Tabel Barrow A2 memberikan tabel 1 F(z) = P(Z > z) untuk nilai z > 0: Jadi dari
tabel di Barrow P(Z > 0:44) = 0:33: Baca kolom pertama sampai 0:4 dan kemudian pergi
melintasi baris ke kolom 0:04. Karena distribusi normal adalah simetris P(Z > z) = P(Z < z):
Jadi P(Z < 0:44) = 0:33 juga.

Normal standar berguna karena kita selalu dapat mengonversi dari Y ke z menggunakan
rumus di atas dan mengonversi dari z kembali ke Y menggunakan

Yi = zi + :

Distribusi berbentuk lonceng dan simetris dengan mean=median=modus.


Rumus untuk distribusi normal adalah
1 yi 2
f(yi) = exp1 ( ) g
hal 2 2 2
2
z saya
1=2
f(zi) = (2) pengalaman
2

di mana zi = (yi )= adalah N (0; 1) standar normal. Distribusi normal adalah eksponensial
2 1=2
kuadrat. (2 membuatnya mengintegrasikan (menjumlahkan)
) dimiliki oleh
ke kesatuan,
semua distribusi
yang seharusnya
probabilitas.

12.2.1. Daerah di bawah distribusi normal

Untuk distribusi normal standar, dengan mean nol dan simpangan baku satu, probabilitas
bahwa variabel acak Z lebih kecil dari nilai spesifik z diberikan di bawah ini untuk berbagai nilai
z: Perhatikan bahwa kami memberikan P(Z < z) untuk nilai z > 0 sedangkan Barrow Table A2
memberikan P(Z > z) untuk nilai z > 0: Tidak ada cara standar untuk menyajikan area di bawah
distribusi normal, jadi periksa bagaimana tabel yang Anda gunakan menyajikannya. z P(Z < z)
0 0:5 0:5 0:6915 0:8413 1:5 0:9332 0:9772

2
Karena distribusi normal adalah simetris, probabilitas menjadi lebih kecil dari rata-rata,
(sesuai dengan z = 0) adalah 0,5, sama dengan probabilitas menjadi

88
Machine Translated by Google

lebih besar dari rata-rata. Ada peluang 84%, untuk mendapatkan nilai lebih kecil dari mean
ditambah satu standar deviasi, z = 1. Peluang berada dalam satu standar deviasi mean
adalah P(1 < Z < +1) = 0.6826=0.8413- (1-0,8413).
Ada kemungkinan 16% (1-0,84) menjadi kurang dari satu standar deviasi di bawah rata-rata,
dan peluang 16% atau lebih dari satu standar deviasi di atas rata-rata. Peluang menjadi lebih
dari dua standar deviasi dari rata-rata adalah 0,0456=2(1-0,9772), kira-kira 5%. 95% dari
distribusi normal terletak dalam 1,96 standar deviasi dari rata-rata, tetapi 2 cukup dekat untuk
sebagian besar tujuan praktis.

12.2.2. Contoh: ekuitas

Misalkan pengembalian riil rata-rata atas ekuitas pada tahun tertentu adalah,

Yt N(10%;(15%)2 );

normal dengan nilai yang diharapkan = 10% dan standar deviasi = 15%: Kita tahu bahwa ada
peluang 50% untuk mendapatkan 10% atau lebih baik, tetapi pengembalian apa yang dapat
kita harapkan bahwa ada peluang 33% untuk mendapatkan itu kembali atau lebih baik? Dari
tabel normal kita dapat menemukan bahwa P(Z > 0:44) = 0:33: Jadi untuk normal standar kita
tahu bahwa kita memiliki peluang ketiga untuk mendapatkan z = 0:44 atau lebih baik. Kami
sekarang ingin mengubahnya menjadi distribusi pengembalian menggunakan Y = z + : Ini
adalah Y = 15 0:44 + 10 = 16:6%: Jadi ada sepertiga peluang untuk mendapatkan
pengembalian 16,6% atau lebih baik. Karena distribusinya simetris, kita juga dapat
menggunakan -0,44 dalam rumus. Ini menunjukkan bahwa ada juga sepertiga peluang untuk
mendapatkan pengembalian Y = 15 (0:44) + 10 = 3:4% atau kurang: Untuk nilai mean dan
standar deviasi ini, sepertiga dari waktu Anda akan menjadi antara 3:4% dan 16:6%, sepertiga
waktu di bawah 3:4% dan sepertiga waktu di atas 16:6%: Perhitungan ini mengasumsikan
bahwa distribusi masa depan akan sama dengan yang kami amati di masa lalu dan ini
mungkin tidak benar. Ini juga mengasumsikan pengembalian normalitas dan ekuitas dapat
menunjukkan peristiwa yang jauh lebih ekstrem daripada yang diharapkan dari distribusi
normal: mereka dikatakan ekor gemuk.

12.2.3. Contoh; nilai ujian

Misalkan kelas matematika terdiri dari Siswa Biru dan Siswa Hijau dengan jumlah yang sama.
Dalam setiap kelompok nilai didistribusikan secara normal, tetapi siswa blues lebih baik dalam
matematika dengan rata-rata 60 dibandingkan dengan rata-rata 55 untuk siswa hijau. Biru

89
Machine Translated by Google

siswa juga kurang menentu dengan standar deviasi 5 dibandingkan dengan standar deviasi 10
untuk siswa hijau. (a) Berapa proporsi siswa biru yang mendapat lebih dari 70? (b) Berapa proporsi
siswa hijau yang mendapat lebih dari 70? (c) Dari mereka yang mendapatkan lebih dari 70,
berapa proporsi yang hijau dan berapa proporsi yang biru?

Menjawab
2
Kami memiliki BN(60; 5 ); GN(55; 102 )
(a) Kami ingin menemukan probabilitas bahwa nilai tersebut lebih dari 70. Untuk siswa Biru

70 60 =
z= 2
5

jadi peluang mendapat nilai lebih dari 70 adalah P(Z > 2) = 1 P(Z < 2) = 1 0:9772 = 0.0228 atau
2.28%. The 0,9772 berasal dari tabel daerah di bawah distribusi normal. (b) Untuk Siswa Hijau

70 55 =
z= 1:5
10

jadi peluang mendapat nilai lebih dari 70 adalah P(Z > 1:5) = 1 P(Z < 1:5) = 1 0:9332 = 0:0668
atau 6,68%. The 0,9332 berasal dari tabel area di bawah distribusi normal.

(c) Di kelas besar dengan jumlah siswa biru dan hijau yang sama, 4,48% dari semua siswa,
(2,28+6,68)/2, akan mendapatkan lebih dari 70. Proporsi siswa yang berwarna biru adalah 25%
(=2,28/( 2.28+6.68)), proporsi yang berwarna hijau adalah 75% (=6.68/(2.28+6.68)).

Meskipun pertanyaannya mengatakan bahwa blues lebih baik dalam matematika dan memang
benar bahwa rata-rata mereka lebih tinggi, tiga perempat dari kelompok teratas dalam matematika
berwarna hijau (seperti tiga perempat dari kelompok bawah). Pelajarannya adalah untuk berpikir
tentang seluruh distribusi, bukan hanya rata-rata atau bagian dari distribusi (misalnya bagian atas
kelas), dan cobalah untuk tidak terpengaruh oleh deskripsi yang sarat nilai: lebih baikíatau kurang
erraticí.

12.3. Distribusi yang berhubungan dengan normal

Kami juga menggunakan distribusi yang merupakan fungsi dari variabel terdistribusi normal.

90
Machine Translated by Google

12.3.1. Chi-kuadrat

Misalkan zi adalah IN(0; 1), terdistribusi secara independen, normal standar dan kami membentuk

2 2
A = Xn z saya
(n)
saya = 1

Maka A dikatakan memiliki distribusi Chi kuadrat dengan n derajat kebebasan.


Perhatikan kuadrat Chi hanya didefinisikan di atas nilai-nilai positif. Selain jumlah
pengamatan dikurangi jumlah parameter yang diestimasi, derajat kebebasan
merupakan parameter distribusi. Distribusi normal memiliki dua parameter yang
menentukan bentuknya, yaitu mean dan varians. Mean menentukan pusatnya dan
varians menentukan penyebarannya. Distribusi Chi-kuadrat memiliki satu parameter,
derajat kebebasannya, yang menentukan bentuknya.
Nilai yang diharapkan sama dengan derajat kebebasannya; variansnya sama dengan
dua kali derajat kebebasannya. Untuk derajat kebebasan yang kecil distribusi kuadrat
Chi miring, untuk derajat kebebasan yang besar distribusinya mendekati normal. Itu
2
muncul secara alami karena kami menghitung perkiraan varians dan distribusi (n 1)s mempunyai sebuah

2= 2 dengan n 1 derajat kebebasan, di mana


N
2 2
detik
= X (xi x) =(n 1)
saya = 1

12.3.2. distribusi t

Normal standar dibagi dengan akar kuadrat dari distribusi Chi-kuadrat, dibagi dengan
derajat kebebasannya, katakanlah n, disebut distribusi t dengan n derajat kebebasan

t(n) = z=r 2 (n) n


Kita sering membagi perkiraan rata-rata atau koefisien regresi (yang terdistribusi
2
normal) dengan kesalahan standarnya (yang merupakan akar kuadrat dari a dibagi
dengan derajat kebebasannya, dan ini adalah rumus untuk melakukan ini. distribusi
memiliki ekor yang lebih gemuk dari biasanya, tetapi karena ukuran sampel semakin
besar, sekitar 30 cukup besar, ketidakpastian karena memperkirakan kesalahan
standar menjadi kecil dan distribusi tidak dapat dibedakan dari normal.Hal ini kadang-
kadang disebut distribusi t Student WS Gosset, yang menemukannya, bekerja untuk
Guinness dan karena peraturan perusahaan harus menerbitkannya dengan nama
samaran, dan dia memilih Siswa.

91
Machine Translated by Google

12.3.3. distribusi F

Distribusi Fisher's F adalah rasio dari dua Chi-kuadrat independen dibagi dengan derajat
kebebasannya.

2
(n1)=n1
F(n1; n2) = :

2 (n2)=n2

Itu muncul sebagai rasio dua varians.


Barrow bab 6 membahas tentang 2 distribusi t dan F.

13. Data Ekonomi dan Keuangan II: tingkat suku bunga, tingkat
pertumbuhan, nilai tukar, dll
13.1. Suku bunga

Ada seperangkat aturan dasar yang berlaku untuk serangkaian tingkat yang berbeda: tingkat
bunga, tingkat pengembalian, tingkat inflasi, tingkat pertumbuhan PDB atau variabel lainnya. Kami
akan menggunakan tingkat bunga atau pengembalian sebagai contoh, tetapi aturan yang sama
berlaku untuk yang lain. Misalkan kita menginvestasikan £ 100, pada tahun 2000, nilai aset naik
menjadi £ 110 pada tahun 2001, £ 121 pada tahun 2001, 133,1 pada tahun 2002, dll. Kita dapat menulis ini

V0 = 100
V1 = 110
V2 = 121
V3 = 133:1

Untuk contoh lain, V mungkin PDB (tingkat pertumbuhan), indeks harga (inasiasi), dll.
Tingkat pengembalian kotor pada tahun pertama adalah (1 + r1) = V1=V0 = 1:1: Tingkat
pengembalian (bersih) pada tahun pertama adalah r1 = (V1 V0)=V0 = V0=V1 1 = 0:1;
persentase tingkat pengembalian adalah 100r1 = 10%: Perhatikan perbedaan antara
proporsional, 0:1 dan persentase, 10%; tingkat bunga dan pengembalian. Suku bunga juga
sering dinyatakan dalam basis poin, 100 basis poin adalah satu poin persentase.
Dari definisi gross return, (1 + r1) = V1=V0; kita dapat menulis V1 = (1 + r)V0: Tingkat
pengembalian dalam contoh ini adalah konstan pada 10%, ri = r = 0:1:
Periksa ini dengan menghitung r2 dan r3: Nilai investasi pada tahun ke-2 adalah

V2 = (1 + r)V1 = (1 + r) 2V0

92
Machine Translated by Google

dan untuk tahun t


Vt = (1 + r) tV0: (13.1)

Perhatikan bagaimana bunga majemuk, Anda mendapatkan bunga yang dibayarkan atas bunga Anda.
Suku bunga sering dinyatakan dengan suku bunga tahunan bahkan ketika suku bunga tersebut untuk
periode yang lebih pendek atau lebih lama. Jika bunga dibayarkan setiap triwulan selama tahun tersebut,
Anda akan mendapatkan 2:5% per kuartal, bukan 10% per kuartal. Namun itu akan dibayarkan empat kali
lebih sering sehingga rumusnya adalah

Vt = (1 + r=4)4tV0
atau jika dibayarkan n kali dalam setahun

Vt = (1 + r=n) ntV0:

Sebagai n ! 1; peracikan kontinu, ini konvergen ke

Vt = e rtV0: (13.2)

Bilangan irasional e 2:718 tampaknya telah ditemukan oleh para bankir Italia yang melakukan bunga
majemuk di akhir abad pertengahan. Karena ln Vt = rt + ln V0 pengembalian majemuk yang kontinu
adalah

d ln V 1 dV
= = r:
dt V dt

Untuk data diskrit ini dapat dihitung sebagai

r = (ln Vt ln V0) =t:

Pengembalian dalam periode apa pun sering dihitung sebagai rt = ln Vt ln Vt1:


Perhatikan bahwa versi diskrit (13.1) benar-benar

r = exp(fln Vt ln V0g=t) 1

Sebagai tambahan
Vt
ln Vt ln Vt1 = ln = ln(1 + rt) rt
Vt1
jika r kecil, misalnya 0:1 pembenaran lain untuk menggunakan selisih logaritma.
Tingkat pertumbuhan dan tingkat inflasi juga dihitung sebagai perbedaan dalam logaritma.
Kalikan dengan 100 jika Anda menginginkan persentase.

93
Machine Translated by Google

Sejauh ini kita telah mengasumsikan tingkat pengembalian adalah konstan. Misalkan alih-alih
berinvestasi dalam aset yang aman dengan pengembalian tetap, kami telah berinvestasi dalam
ekuitas spekulatif dan nilai aset kami pada tahun 2000, 2001, dan 2002 adalah

V0 = 100
V1 = 1000
V2 = 100

jadi r1 = 1000=100 1 = 9 = 900%; r2 = 100=1000 1 = 0:9 = 90%. Pengembalian rata-rata (rata-rata


aritmatika) adalah (90090)=2 = 405%: Contoh ini memunculkan dua masalah. Persentase pertama
tidak simetris. Investasi kami kembali ke titik awal setelah peningkatan 900% dan hanya penurunan
90%. Kedua, rata-rata aritmatika tampaknya bukan indikator yang sangat baik untuk pengembalian
rata-rata (kecuali mungkin bagi penjual yang menjual saham kepada kita). Kami mendapatkan
pengembalian rata-rata 405% dan memiliki jumlah yang persis sama seperti saat kami memulai.
Pengembalian rata-rata geometrik dalam hal ini adalah nol

GM = p (1 + r1)(1 + r2) 1 = p (10)(0:1)


1=p1
1=0

yang tampaknya lebih masuk akal.


Ada juga suku bunga pada berbagai jatuh tempo, tergantung pada berapa lama uang itu
dipinjam atau dipinjamkan. Pola suku bunga terhadap jatuh tempo disebut dengan istilah struktur
suku bunga atau kurva imbal hasil. Biasanya istilah struktur miring ke atas. Suku bunga panjang,
suku bunga atas uang yang dipinjam untuk jangka waktu yang lama, seperti obligasi pemerintah
10 tahun, lebih tinggi daripada suku bunga pendek, uang yang dipinjam untuk jangka waktu yang
singkat, seperti Surat Perbendaharaan Negara 3 bulan. Suku bunga biasanya dinyatakan pada
tingkat tahunan, berapa pun lamanya investasi. Ketika kebijakan moneter ketat, struktur istilah
mungkin miring ke bawah, kurva imbal hasil terbalik: suku bunga pendek lebih tinggi daripada
suku bunga panjang.
Ini sering ditafsirkan sebagai prediktor resesi yang akan datang. Kebijakan moneter dioperasikan
oleh Bank Sentral melalui pengendalian suku bunga short overnight yang disebut suku bunga
kebijakan, suku bunga Repo, Suku Bunga Bank atau dalam Tingkat Dana Federal AS. Biasanya
kurs pendek lainnya seperti LIBOR (London Inter-Bank O§er Rate, kurs di mana bank saling
meminjamkan) sangat dekat dengan kurs kebijakan.
Namun, selama krisis kredit mulai Agustus 2007 mereka menyimpang: Bank membutuhkan premi
risiko untuk meminjamkan ke bank lain.

94
Machine Translated by Google

13.2. Nilai tukar

13.2.1. Spot dan maju

Nilai tukar spot adalah nilai pengiriman sekarang: pertukaran terjadi segera. Nilai tukar spot
biasanya dikutip sebagai mata uang domestik per unit mata uang asing, dengan dolar
diperlakukan sebagai mata uang asing: Franc Swiss per Dolar misalnya. Kenaikan menunjukkan
depresiasi dalam Franc Swiss: lebih banyak Franc Swiss diperlukan untuk membeli satu dolar.
Beberapa dikutip sebagai mata uang asing per unit domestik, khususnya Sterling, yang dikutip
Dolar per Pound. Dalam hal ini kenaikan menunjukkan apresiasi Pound, satu pon membeli lebih
banyak dolar. Tarif forward adalah untuk pengiriman pada suatu waktu di masa depan. Kurs
forward satu tahun adalah untuk pengiriman dalam waktu satu tahun ketika pertukaran terjadi
pada kurs yang dikutip dan disepakati hari ini.

13.2.2. Paritas bunga tertutup

Misalkan Anda memiliki $ 1 juta dan tahu bahwa Anda akan membutuhkan Sterling dalam waktu
beberapa tahun. Anda dapat mengonversi Dolar menjadi Sterling sekarang dengan memberi
Anda £ 1/S m, di mana S adalah kurs spot, (£ 0,548 m pada kurs spot pada 27/7/4 dari 1,8245$/£ ).
, UK R£ 5.3375% (satu tahun £
Anda dapat menginvestasikan ini selama setahun dengan suku bunga
Libor (London Inter Bank O§er Rate) pada hari yang sama). Jadi dalam waktu beberapa tahun Anda
akan memiliki £ (1+R)/S m (£ 0,577m). Atau Anda dapat menginvestasikan Dolar di AS dengan
mendapatkan nilai R$, 2,43% ($ Libor) sehingga Anda akan memiliki $(1+R$) m ($1.0243m) dalam
waktu beberapa tahun. Anda dapat menjual dolar ini untuk pengiriman dalam setahun dengan kurs
forward F, (1,7752). Ini berarti bahwa dalam waktu beberapa tahun Anda akan memiliki £ (1+R$)/F m (£ 0,577 juta).
Keduanya bebas risiko (dengan asumsi bank membayar kembali deposit Anda, yaitu tidak ada risiko default)
sehingga pengembaliannya harus sama, sebagaimana adanya. Anda mendapatkan £ 577.000 dengan salah satu rute.
Tarif ini diberikan setiap hari di FT. Mengekspresikannya sebagai rumus

1 + R$ 1 + R$
=
S F
F 1 + R$
=
S 1 + R$

Atau kira-kira
FS
R$ R$
S
dimana istilah di sisi kiri disebut forward premium, ketika positif atau diskon ketika negatif dan
istilah di sisi kanan bunganya berbeda.

95
Machine Translated by Google

penting. Hubungan ini disebut paritas bunga tertutup dan mengikuti dari arbitrase.
Jika tidak memegang bank bisa membuat pengembalian tanpa risiko dengan memanfaatkan perbedaan.
Perhatikan bahwa kurs forward pada 27/7/4 mengindikasikan bahwa pasar memperkirakan
nilai sterling akan turun selama tahun depan. Bahkan karena ditentukan oleh perbedaan
tingkat bunga, kurs forward cenderung menjadi prediktor yang buruk untuk kurs spot masa
depan. Dalam hal ini kurs pada 29/7/5 adalah $1,759, jadi kurs forward adalah prediktor
yang cukup baik. Verbeek bagian 4.11 memberikan beberapa contoh empiris penggunaan
hubungan ini.

13.2.3. Tarif nyata dan efektif

Misalkan Big Mac berharga $X di AS dan £ Y di Inggris dan kurs spotnya adalah S, misalnya
1,6$/£ . Maka harga relatif Big Mac di Inggris dan AS adalah dolar
M
Q = ($YS)=$X

ini adalah nilai tukar riil Big Mac, yang diterbitkan oleh Economist. Perhitungan serupa
dilakukan untuk seluruh perekonomian dengan menggunakan indeks harga, untuk
menghitung nilai tukar riil negara tersebut: Q = PS=P; di mana P adalah indeks harga luar
negeri dan P adalah indeks harga domestik. Purchasing Power Parity (PPP) mengatakan
bahwa perdagangan akan menyamakan harga antar negara dan nilai tukar riil akan konstan,
dalam jangka panjang. Seperti yang dikatakan Keynes 'Dalam jangka panjang, kita semua
mati' dan penyimpangan dari PPP bisa sangat persisten.
Setiap mata uang memiliki sejumlah besar nilai tukar dengan semua mata uang lainnya,
sehingga 'trade weighted averages' atau nilai tukar efektif sering dihitung, yang memberikan
nilai tukar rata-rata dengan semua mata uang lainnya, bobot yang mencerminkan
kepentingan relatifnya dalam perdagangan. Misalkan kita menyatakan tahun dasar sebagai
tahun nol, misalnya 2000, maka indeks pada tahun t adalah
Duduk

Ini = Xwi( )
Si0
dimana wi adalah persentase bagian perdagangan dengan negara i sehingga Pwi = 100;
Sio adalah nilai tukar dengan negara i pada tahun dasar dan Sit adalah nilai tukar pada
tahun t: Nilai indeks pada tahun nol, I0 = 100:

14. Latihan Terapan II: Distribusi Sampling


Sisa catatan berkaitan dengan estimasi dan pengujian hipotesis.
Ini bertumpu pada gagasan distribusi sampling, sampel tertentu yang kita ambil

96
Machine Translated by Google

hanyalah salah satu dari sejumlah besar sampel yang mungkin kita ambil. Latihan ini
dirancang untuk mengilustrasikan ide distribusi sampling. Anda tidak memerlukan data
apa pun untuk latihan ini, Anda membuatnya sendiri.
Masuk ke Excel dan di sel A1 ketik =RAND(). Ini menghasilkan nomor acak yang
terdistribusi secara seragam selama interval nol-satu. Setiap angka pada interval
tersebut memiliki peluang yang sama untuk ditarik. Salin sel ini ke semua sel hingga O1.
Di P1 ketik =AVERAGE(A1:O1). Di Q1 ketik =STDEVP(A1:O1). Dalam tipe R1
=STDEV(A1:O1). Salin baris ini ke baris 100.
Anda sekarang memiliki 100 sampel dari 15 pengamatan dari distribusi seragam
dan 100 perkiraan rata-rata dan 100 perkiraan untuk masing-masing dari dua penduga
simpangan baku. Penaksir adalah rumus yang memberi tahu Anda cara menghitung
perkiraan dari sampel tertentu; perkiraan adalah jumlah yang dihasilkan dari penerapan
estimator ke sampel.
Kita kemudian dapat melihat distribusi sampling dari mean dan standar deviasi.
Hitung dan gambar histogram untuk 100 estimasi mean.
Lakukan hal yang sama untuk kedua penduga simpangan baku. Apa pendapat Anda
tentang bentuk mereka? Apakah mereka dekat dengan distribusi normal? Pergi ke
P101, ketik =AVERAGE(P1:P100). Pergi ke P102 ketik =STDEV(P1:P100). Pergi ke
P103 ketik =SKEW(P1:P100). Pergi ke P104 ketik KURT(p1:p100). Salin ini ke kolom
Q dan R untuk memberikan statistik deskriptif untuk dua perkiraan deviasi standar.

Jika x terdistribusi merata pada [a; b] maka E(x) = (a + b)=2 dan V ar(x) = (ba)
2=12: Dalam hal ini a = 0; b = 1, jadi rata-rata teoretis harus 0,5 (bandingkan ini dengan
angka di sel P101) dan varians teoretis 1/12, dengan standar deviasi p 1=12 =
0.288675 (bandingkan ini dengan angka di Q101, yang seharusnya bias ke bawah dan
dengan nomor di R101, yang seharusnya lebih dekat). Simpangan baku rata-rata dari
sampel berukuran N (dalam hal ini 15) adalah

SD(x) = p V ar(x)=N
jadi kami mengharapkan standar deviasi dari distribusi sarana kami menjadi 0,07453
(bandingkan ini dengan angka di P102). Ketika N menjadi besar (jumlah pengamatan
dalam setiap sampel, 15 dalam hal ini yang tidak terlalu besar), distribusi mean
cenderung normal (teorema limit pusat). Apakah ukuran skewness dan kelebihan
kurtosis yang diberikan pada P103 dan P104 menunjukkan bahwa cara ini normal?
Nilai harus mendekati nol untuk normalitas. Apakah mean lebih terdistribusi normal
daripada standar deviasi?
Apa yang telah kami lakukan di sini disebut simulasi Monte Carloí. Kami punya mantan

97
Machine Translated by Google

menguji sifat-sifat estimator dengan menghasilkan banyak data secara acak dan melihat distribusi
perkiraan dari banyak sampel. Dalam praktiknya, 100 ulangan sampel agak kecil, dalam studi Monte
Carlo biasanya digunakan ribuan ulangan. Karena 100 cukup kecil, Anda akan mendapatkan jawaban
yang agak berbeda (misalnya untuk rata-rata keseluruhan) dari saya. Namun, dengan membuat
jumlah ulangan yang cukup besar, kita dapat membuat perbedaan antara Anda dan saya sekecil yang
kita inginkan (hukum bilangan besar).

Dalam hal ini, kita tidak perlu melakukan Monte Carlo karena kita dapat menurunkan sifat-sifat
estimator secara teoritis. Tetapi untuk masalah yang lebih rumit ini tidak terjadi dan kita harus
melakukannya secara numerik seperti di sini. Namun, melakukan Monte Carlo memberi Anda
gambaran tentang apa yang kami maksud ketika kami membahas distribusi penduga.

15. Estimasi
15.1. pengantar

Di bagian pertama kursus kita melihat metode untuk mendeskripsikan data, misalnya menggunakan
ukuran seperti mean (rata-rata) untuk meringkas nilai khas yang diambil variabel. Di bagian kedua
kursus, kita belajar bagaimana membuat pernyataan probabilitas. Sekarang kami ingin menggabungkan
keduanya dan menggunakan teori probabilitas untuk menilai seberapa besar kepercayaan yang kami
miliki dalam statistik ringkasan kami. Kerangka kerja yang akan kita gunakan untuk melakukan ini
adalah matematika, kita akan membuat beberapa asumsi dan memperoleh beberapa hasil dengan
deduksi. Bab 4 dan 5 dari Barrow membahas masalah ini.
Ada beberapa langkah.

1. Kita mulai dengan model proses yang menghasilkan data. Misalnya, teori pasar yang efisien
mengatakan bahwa pengembalian saham pada periode t, Yt = + ut Dimana Yt adalah
pengembalian, yang dapat kita amati dari data historis, adalah pengembalian yang diharapkan,
parameter yang tidak diketahui, dan ut adalah kesalahan acak tak terduga yang mencerminkan
semua informasi baru dalam periode t: Kami membuat asumsi tentang sifat kesalahan ut :
Kami mengatakan bahwa kesalahan ut 'berperilaku baik' ketika rata-rata nol, E(ut) = 0; tidak
berkorelasi melalui waktu E(utut1) = 0; dan memiliki varians konstan, E(u
2 2
t ) = :

2. Kami kemudian bertanya bagaimana kami dapat memperoleh penaksir dari parameter yang
tidak diketahui: Penaksir adalah formula untuk menghitung perkiraan dari sampel tertentu.
Kami akan menggunakan dua prosedur untuk memilih estimator b, (kata alpha

98
Machine Translated by Google

hat) yang memberikan


; Yt = b+ubt : (1) metode momen, yang memilih estimator yang
membuat asumsi populasi kita, misalnya E(ut) = 0; hold in Pubt = 0 (2) least squares,
1
varians terkecil dan meminimalkan
yang memilih Pub
estimator
t . Dalam
sampel
kasus
sehingga
kita melihat
N yangduamemiliki
prosedur ini
2
memberikan estimator yang sama, tetapi hal ini umumnya tidak benar.

3. Kami kemudian menanyakan seberapa bagus estimatornya. Untuk melakukan ini, kita
perlu menentukan apa nilai yang diharapkan dari estimator dan varians dari estimator,
atau akar kuadratnya: kesalahan standar. Kami kemudian perlu memperkirakan
kesalahan standar ini. Dengan asumsi kami, kami dapat menurunkan semua hal ini
secara matematis dan memungkinkan kami untuk menentukan seberapa yakin kami
dalam perkiraan kami. Perhatikan bahwa akar kuadrat dari varians suatu variabel
disebut deviasi standarnya, akar kuadrat dari varians estimator disebut eror standarnya.

4. Kami kemudian sering ingin menguji hipotesis. Misalnya, dari Latihan Terapan I, kami
menemukan bahwa rata-rata pengembalian riil ekuitas selama periode 1872-1999
adalah 0,088 (8,8%) dengan standar deviasi 0,184; tetapi mean 1872-1990 hanya
0,080, sedangkan return selama 1991-1999 adalah 0,18 (18%) dengan standar
deviasi 0,15. Pada tahun 2000, Anda mungkin ingin bertanya apakah benar-benar
ada Ekonomi Baru, dengan pengembalian yang jauh lebih tinggi (lebih dari dua kali
rata-rata historis) dan risiko yang lebih rendah (standar deviasi yang lebih rendah);
atau apakah Anda mungkin hanya mendapatkan angka-angka yang diamati selama
tahun 1990-an, murni secara kebetulan.

5. Karena turunan matematis kita bergantung pada asumsi kita, kita perlu memeriksa
b

apakah asumsi kita benar. Setelah kita mengestimasi estimasi ubt = Yt Kemudian
kita dapat
b

kita dapat menanyakan apakah


variansestimasi
:
yang konstan.
error kita tidak berkorelasi dan memiliki

Kami akan melalui prosedur ini dua kali, pertama untuk memperkirakan rata-rata sampel
atau nilai yang diharapkan dan menguji hipotesis tentang hal itu, dan kemudian mengikuti
prosedur yang sama untuk model regresi, di mana nilai yang diharapkan tidak konstan,
tetapi tergantung pada variabel lain.

15.1.1. Sebuah peringatan

Prosedur yang akan kita bahas disebut inferensi statistik klasik dan pendekatan Neyman-
Pearson untuk pengujian. Ketika pertama kali ditemui mereka mungkin tampak

99
Machine Translated by Google

kontra-intuitif, rumit dan bergantung pada banyak konvensi. Tapi begitu Anda terbiasa, mereka cukup
mudah digunakan. Motivasi untuk mempelajari prosedur-prosedur ini adalah bahwa prosedur-prosedur
ini menyediakan pendekatan standar untuk menangani bukti kuantitatif dalam sains dan bidang
kehidupan lainnya, di mana prosedur-prosedur tersebut bermanfaat.
Namun, karena kontra-intuitif dan rumit, mudah untuk membuat kesalahan. Dikatakan bahwa cukup
banyak artikel ilmiah yang menggunakan statistik mengandung kesalahan perhitungan atau interpretasi.
Kesalahan umum adalah mengacaukan signifikansi statistik dengan kepentingan substantif. Signifikansi
hanya mengukur apakah suatu perbedaan dapat muncul secara kebetulan, tetapi tidak mengukur
apakah ukuran perbedaan itu penting. Ada pendekatan lain untuk statistik berdasarkan Teorema Bayes.
Dalam banyak hal, statistik Bayesian lebih bersifat intuitif, karena tidak melibatkan membayangkan
banyak sampel hipotetis seperti yang dilakukan statistik klasik. Secara konseptual lebih koheren, karena
hanya melibatkan penggunaan data baru Anda untuk memperbarui probabilitas sebelumnya seperti
yang kami lakukan di bagian 10.2.2.

Namun, seringkali secara matematis lebih kompleks, karena biasanya melibatkan integral. Komputer
modern membuat integrasi ini lebih mudah. Gary Koop, Bayesian Econometrics, Wiley 2003 memberikan
pengantar yang bagus.
Penting untuk membedakan dua hal berbeda yang kita lakukan. Pertama, dalam statistik teoretis
kita membuat deduksi matematis: misalnya membuktikan bahwa penduga memiliki varians minimum
dalam kelas penduga tak bias linier.
Kedua, dalam statistik terapan, kita membuat induksi, menarik kesimpulan umum dari serangkaian
pengamatan tertentu. Induksi penuh dengan kesulitan filosofis. Bahkan jika setiap angsa yang kita lihat
berwarna putih, kita tidak berhak untuk mengklaim 'semua angsa berwarna putih', kita belum melihat
semua angsa. Tapi melihat satu angsa hitam membuktikan bahwa klaim 'semua angsa putih' adalah
salah. Mengingat hal ini, tidak mengherankan bahwa ada perdebatan metodologis yang panas tentang
cara yang benar untuk melakukan statistik terapan dan tidak ada aturan 'benar'. Apa yang masuk akal
tergantung pada tujuan latihan. Kennedy, A Guide to Econometrics, edisi kelima bab 21 membahas
masalah ini.

15.2. Memperkirakan nilai yang diharapkan.

Misalkan kita memiliki sampel data independen dari waktu ke waktu Y1; Y2; :::; YT ;

Yt = + ut

2
di mana ut adalah variabel acak dengan mean nol dan variansi tidak dan pengamatan
2 2
berkorelasi atau independen sepanjang waktu; yaitu E(ut) = 0, E(u t )= ,

100
Machine Translated by Google

E(ututi) = 0: Perhatikan jumlah observasi disini adalah T, sebelumnya kita menggunakan N atau
n untuk jumlah pengamatan. Kami ingin memilih prosedur untuk memperkirakan
parameter yang tidak diketahui dari sampel ini. Kami akan memanggil estimator b (berkata
alpha hat). Kami mendapatkan perkiraan dengan memasukkan nilai untuk sampel tertentu
b

ke dalam rumus. Kami menurunkan estimator dalam dua cara: metode momen
yang cocok dengan data sampel dengan asumsi populasi dan kuadrat terkecil kami
yang meminimalkan varians.

15.2.1. Metode momen.

Kami berasumsi bahwa E(Yt) = yang


b
; menyiratkan E(ut) = E(Yt ) = 0: Mari kita
memilih estimator sedemikian rupa sehingga sampel setara dengan nilai yang diharapkan,
(rata-rata) dari (Yt b) juga sama dengan nol. Yaitu kita ganti E(Yt ) = 0 dengan
b

T 1 PT t=1(Yt b) = 0: Ini mengimplementasikan T 1 nPTt = 1 Yt T 1 PTt=1 Yt = :

bo = 0 atau T
Jadi estimator yang membuat sampel ekuivalen dengan E(Yt ) = 0 hold adalah
b

berarti, jadi = Y . Perhatikan bahwa derivasi ini juga menyiratkan bahwa PT t=1(Yt b) = 0, the
jumlah deviasi dari mean selalu nol

15.2.2. kuadrat terkecil


b

Atau misalkan, kita memilih penduga,


2
deviasi, S = yang membuat jumlah kuadrat
P(Yt b) sekecil mungkin. Ini juga akan meminimalkan
b2
varians yang diperkirakan, = P(Yt b) 2=T:
T
2
S=X (Yt b)
t=1

b2
= X(Y2
t + 2 Ybt )
b2
t +T 2
= XY 2 b XYt
b

Untuk menemukan yang meminimalkan ini, kami mengambil turunan pertama dari S sehubungan
b

ke dan atur sama dengan nol:

@S b

= 2T
@
b
2 XYt = 0:

Bagi dengan 2, pindahkan PT t=1 Yt ke sisi lain dari kesetaraan,

101
Machine Translated by Google

memberikan T = PYt atau


T
b

=X Yt=T:
t=1
b

jadi lagi =Y:

15.3. Sifat-sifat penaksir

Kami membedakan, antara parameter benar (atau populasi) dan penduga


b

= PYi=n; rumus yang memberi tahu Anda cara menghitung perkiraan dari suatu partikel b

sampel. Sampel yang berbeda akan memberikan estimasi yang berbeda, adalah acak
begitu bervariasi. Ketika estimator yang berbeda tersedia, dalam hal ini median mungkin
estimator alternatif, kita perlu kriteria untuk memilih antara estimator yang berbeda.
Salah satu kriterianya adalah bahwa penaksir tidak bias, rata-rata (lebih dari banyak
sampel hipotetis) sama dengan nilai sebenarnya. Nilai yang diharapkan dari penduga adalah
sama dengan nilai parameter yang sebenarnya. Properti lain yang sering diinginkan
adalah bahwa perkiraan cenderung mendekati nilai sebenarnya; untuk penduga tak bias
ini berarti bahwa estimator memiliki varians yang kecil.

15.3.1. Nilai yang diharapkan dari

Untuk mengetahui apakah mean tidak bias kita perlu menghitung nilai yang diharapkan
b

dari : Ini adalah


b

= XYt=T = X( + ut)=T = T =T + (Xut=T)

E( b) = + E( Xut=T) =
b

Karena E(ut) = 0: Jadi tidak bias di bawah asumsi kami. Dari turunan ini
kita lihat bahwa:
b

= Xut = T
sementara rata-rata pada banyak sampel hipotetis, Put=T mungkin nol, itu akan
tidak nol dalam sampel tertentu, jadi perkiraan kami akan berbeda dari yang sebenarnya
nilai. Sekarang mari kita hitung seberapa besar kemungkinan perbedaannya.

102
Machine Translated by Google

15.3.2. Varians dan kesalahan standar mean


b

varian dari 2 . Sejak


; katakan V ( b) = E( b E( b))2 = E( b ) karena E( b) =
b

= Masukan = T
2
E(b) = E( Xut=T) 2
Ruas kanan dapat ditulis

u1 u2 uT ++ ::: + u1 uT
=E u2 + + ::: +
T T T T T T
2 2
Produk ini akan memiliki istilah T. Ada suku T dengan kuadrat seperti u dan 2 suku T dengan hasil
1, kali
silang seperti u1u2. Harapan dari kuadrat adalah T diasumsikan konstan
2 2 2
E(u karena
t )=T2 =
varians
2=T2 ,dari ut untuk semua t. Ada T suku , E (u t ) = ;

seperti ini, jadi jumlahnya adalah T( 2=T2 ) = 2=T: Ekspektasi dari perkalian silang berbentuk E(ututj )=
T2 : Tetapi karena galat diasumsikan bebas E(ututi) = 0; untuk i 6= 0, maka ekspektasi semua suku
hasil kali silang sama dengan nol, maka kita telah menurunkan varians dari mean, yaitu:

2
V ( b) = E( b E( b))2 =
T
di mana T adalah jumlah pengamatan.
Akar kuadrat dari varians = p T disebut standar error dari mean. Ini digunakan untuk memberikan
indikasi seberapa akurat perkiraan kami. Perhatikan ketika kita mengambil akar kuadrat dari varians
variabel, kita menyebutnya standar deviasi; ketika kita mengambil akar kuadrat dari varians estimator,
kita menyebutnya kesalahan standar. Keduanya hanya akar kuadrat dari varians.

15.3.3. Memperkirakan varians

Ada dua estimator umum dari varians Y:


2
b2
= P(Ytb )
T
2
2
= P(Ytb )
detik

T1
b2
estimator pertama, ; kadang-kadang disebut varians populasi, yang membagi
2
dengan T adalah estimator bias dari ;
T1
2 < 2
E( b 2 ) = :

103
Machine Translated by Google

Buktinya sederhana, tapi panjang, jadi kami tidak memberikannya. Penduga kedua, kadang-
2

; kadang disebut varians sampel, adalah penduga tak bias. Bias muncul karena kita
detik

menggunakan estimasi mean dan dispersi di sekitar estimasi akan lebih kecil daripada dispersi
di sekitar nilai sebenarnya karena mean estimasi dirancang untuk membuat dispersi sekecil
mungkin. Jika kita menggunakan nilai sebenarnya dari tidak akan ada bias. Koreksi T 1 disebut
derajat kebebasan: jumlah pengamatan dikurangi jumlah parameter yang diestimasi, satu dalam
hal ini, b. Kami memperkirakan kesalahan standar rata-rata dengan

s
SE( b) = p
T

Pada asumsi yang telah kita buat dapat ditunjukkan bahwa mean adalah penduga varians
minimum dari nilai yang diharapkan di antara semua penduga yang merupakan fungsi linier dari
Yi dan tidak bias. Ini digambarkan sebagai mean sebagai Penaksir Tak Bias Linier Terbaik
(varian minimum) (BLUE) dari nilai yang diharapkan dari Y: Ini dibuktikan kemudian dalam
konteks yang lebih umum, tetapi ini adalah hasil alami karena kami memilih penduga ini untuk
meminimalkan perbedaan.

15.3.4. Sifat asimtotik

Dalam banyak kasus kita tertarik pada apa yang terjadi pada sifat-sifat estimator ketika T
b2 2
menjadi besar. Jadi meskipun yang dibagi dengan T adalah penduga bias dari ;

T1
2
E( b 2 ) =
T

sebagai T! 1; (T1)=T! 1 dan biasnya hilang. Selain itu sebagai T ! 1 kesalahan standar rata-rata
=p T ! 0, distribusi estimasi semakin mendekati nilai sebenarnya sehingga dengan T = 1 tidak
ada dispersi sama sekali, estimator konvergen ke nilai sebenarnya, kita dapat memperkirakannya
dengan tepat. Penaksir yang memiliki sifat ini dikatakan konsisten. Verbeek bagian 2.6
membahas sifat asimtotik.

15.3.5. Ringkasan

Sejauh ini kita telah (1) menemukan bagaimana memperkirakan nilai yang diharapkan dari Y =
E (Y ) dengan mean; (2) menunjukkan bahwa jika nilai yang diharapkan dari kesalahan adalah
nol berarti adalah penaksir yang tidak bias, (3) menunjukkan bahwa jika kesalahan juga memiliki
2
varians konstan dan independen, varians dari mean adalah 2=T dimana T adalah nomor

104
Machine Translated by Google

pengamatan (4) menunjukkan bahwa kesalahan standar rata-rata dapat diperkirakan dengan
2
s=p T adalah; dimana
penaksir varians
tak biasminimum
dari varians
yang
dan
mungkin
menyatakan
di antara
(5) bahwa
penduga
rata-rata
tak biasmemiliki
linier
(Gauss-Markov teorema) dan (6) bahwa untuk T besar distribusi akan normal berapa pun
b

distribusi Y; (teorema limit pusat). ;

15.3.6. Contoh Latar Belakang: proporsi

Kami juga sering menggunakan proporsi sampel untuk memperkirakan probabilitas. Barrow Bab 4
mencakup proporsi. Misalnya di 10.2.2 kami menemukan dari sampel n =1000 perusahaan yang
450 melaporkan tidak melakukan inovasi produk dan proses, jadi kami memperkirakan P(N) = p =
0:45. Seandainya kami mengambil sampel perusahaan yang berbeda, kami akan mendapatkan
perkiraan yang berbeda dan hanya jika kami telah mengambil sampel semua perusahaan dalam
perekonomian, populasi, apakah kami akan yakin bahwa kami mendapatkan proporsi non-inovator
yang sebenarnya. Kami ingin tahu seberapa akurat perkiraan kami, apa kesalahan standarnya?
Dalam kasus proporsi kesalahan standar adalah

= 0:0157
SE(p) = rp(1 p) = rn 0:45 0:55 1000

Jadi dengan sampel 1000 standard error kami pada estimasi proporsi 45% adalah 1,57%.
Seringkali rumus diberikan dengan menggunakan q = 1 Dalam p: merancang survei, penting
untuk memeriksa bahwa: sampel Anda mewakili, sampel acak adalah yang terbaik; tidak
bias oleh non-respons (inovator mungkin lebih cenderung mengisi formulir); pertanyaannya
jelas, dalam hal ini perusahaan mungkin berbeda tentang apa yang mereka pikirkan tentang
inovasi; dan sampelnya cukup besar. Barrow bab 9 membahas masalah ini. Misalkan Anda
berpikir bahwa kesalahan standar 1,5% terlalu besar dan ingin menguranginya menjadi 1%,
seberapa besar survei yang diperlukan. Panggil SE(p) x yang kita inginkan: Maka kita perlu

x = Rp(1p) n
2x = p(1 p)=nn =
p(1 p)=x2

untuk mendapatkan x = 1% kita membutuhkan n = (0:45 0:55)=(0:01)2 = 2475: Anda perlu


melipatgandakan sampel.

105
Machine Translated by Google

16. Interval kepercayaan dan Uji Hipotesis


Sebelumnya kami mencatat bahwa jika variabel terdistribusi normal, mean plus atau minus dua
standar deviasi diharapkan mencakup sekitar 95% dari pengamatan. Rentang ini, plus atau
minus dua standar deviasi disebut interval kepercayaan 95%. Selain membangun interval
kepercayaan untuk variabel, kami juga membangun interval kepercayaan untuk estimasi mean
kami, di mana kami menggunakan kesalahan standar mean daripada deviasi standar. Barow
Bab 4 membahas masalah ini.

16.1. Contoh: apakah Ekonomi Baru berbeda?


b

Kami sering ingin membandingkan estimasi kami, Untuk mengilustrasikan


dengan beberapa nilai prosedur,
hipotesis misalkan
0:
pengembalian riil rata-rata ekuitas 1991-1999 adalah 18%, dan rata-rata 1872-1990 adalah 8%.
Periksa angka sebenarnya dari Latihan Terapan I. Pada akhir tahun 1990-an banyak orang
percaya bahwa telah terjadi perubahan struktural dan kedatangan "Ekonomi Baru" menghasilkan
pengembalian yang diharapkan jauh lebih tinggi daripada rata-rata historis. Dalam hal ini 0 =
8%; hipotesis kami adalah bahwa pengembalian yang diharapkan sebenarnya selama tahun 1990-
an adalah rata-rata historis jangka panjang. Perkiraan kami adalah rata-rata selama tahun 1990-
b

an, = 18%; diperkirakan pada T = 9 pengamatan. Sebagai perkiraan kami dari standar deviasi

(akar kuadrat varians) pengembalian, kami akan menggunakan perkiraan selama seluruh
periode, = 18:4%; : dengan asumsi bahwa varians tidak berubah dan kita mengetahuinya
dengan tepat. Ini sangat menyederhanakan perhitungan, jika kita menggunakan varians estimasi
1991-99 kita akan memiliki kesalahan sampling yang lebih besar dan harus menggunakan
distribusi t daripada normal. Dengan menggunakan rumus di atas, kesalahan standar rata-rata
kami untuk tahun 1990-an adalah:

se( b) = =p T = 18:4= p 9 = 6:13:

Perhatikan bahwa kita menggunakan mean yang dihitung selama 9 tahun, 1991-99, jadi kita
bagi dengan p 9; bukan dengan jumlah tahun yang kita gunakan untuk menghitung standar deviasi.
Jika perkiraan rata-rata kami terdistribusi normal, dengan nilai harapan sebenarnya = 8%, kami
0 berharap ada peluang 95% dari perkiraan jatuh ke
jangkauan
1:96se( b) = 8 1:96 (6:13) = 8 12:

Dengan demikian kita akan 95% yakin bahwa kisaran 4 hingga +20 akan mencakup nilai
sebenarnya: Ada kemungkinan 2:5% bahwa rata-rata 9 tahun akan berada di atas 20% dan

106
Machine Translated by Google

2:5% kemungkinannya akan di bawah -4%. Perkiraan historis jatuh dalam kisaran ini
jadi bahkan jika pengembalian yang diharapkan sebenarnya sama dengan nilai historisnya, 8%; kita akan
berharap untuk melihat pengembalian rata-rata 9 tahun sebesar 18% hanya secara kebetulan, lebih dari 5% dari
waktu. Misalkan nilai harapan sebenarnya adalah 8%, berapa probabilitas mengamati?
18% atau lebih? Kita bisa membentuk
b

18 8 10
z= = = = 1:63
se(b) 6:13 6:13

Dengan menggunakan tabel-tabel distribusi normal kita nd P(Z 1:63) = 0,0516: Just
lebih dari 5% dari waktu, kami akan mengamati periode 9 tahun dengan pengembalian rata-rata 18%
atau lebih besar, jika pengembalian yang diharapkan konstan pada 8%.
Ini mengasumsikan semuanya berdistribusi normal, jika distribusinya lebih berat
ekor dari biasanya, probabilitas ini akan menjadi sedikit lebih besar. Kami juga bisa
b

pusatkan interval kepercayaan kita dan laporkan


daripada
b 1:96se( b):0Ini
akan menjadi 18 12 kisarannya, 6 hingga 30: Perhatikan interval kepercayaan ini mencakup
maksud historis.
Kami akan menyimpulkan bahwa, dengan asumsi normalitas, pada tingkat 95%, tahun 1990-an
return secara statistik tidak berbeda secara signifikan dari mean historis.

16.2. Interval kepercayaan


b

Misalkan Yt = + ut : Kita bisa mendapatkan perkiraan, ; dari sampel T . kami


b

pengamatan : Jika ut terdistribusi normal, karena hanya juga akan terdistribusi secara normal,
b b

merupakan fungsi linier dari


berdistribusi u: Jikameskipun
normal, sampel cukup besar
ut tidak normal. Kami melihat itu juga akan

=+X ut=T
t

Jadi
2
b N( ; dan =T)
b

s( b) = =p T adalah kesalahan standar dari dapat diperkirakan dengan, sd( ) = s=p T ;

di mana

T1
s = rP(Yt b) 2
b

Dari tabel distribusi normal, kita tahu bahwa 95% pasti b 1:96s( b) adalah
akan berada dalam 1,96 kesalahan standar dari nilai sebenarnya: Kisaran

107
Machine Translated by Google

disebut interval kepercayaan 95%. Interval kepercayaan 68% adalah bs( b) : kisaran yang
dicakup oleh perkiraan plus dan minus satu kesalahan standar akan mencakup nilai sebenarnya
lebih dari dua pertiga waktu. Jika interval kepercayaan itu mencakup beberapa nilai yang
dihipotesiskan maka kita 0;
mungkin yakinstandar
kesalahan bahwa dari
nilainilai
sebenarnya bisa lebih dari
yang dihipotesiskan, 0;sekitar 2 tidak
kami pikir
b

0: Jika
mungkin bahwa perbedaan itu bisa terjadi secara kebetulan (kemungkinannya kurang
dari 5%) dan kami mengatakan perbedaan itu signifikan secara statistik. Itulah kami menghitung
statistik uji
b

= 0

SD()

0 pada
hipotesis nol bahwa = dari statistik uji lebih besar dari 1,96.taraf
Kita5%
jugajika nilaimenghitung
dapat mutlak dan nilai
menolak
pí,
probabilitas mendapatkan nilai pengamatan jika hipotesis itu benar dan menolak hipotesis jika
nilai p kurang dari 0,05.

16.3. sampel kecil

Misalkan kita memiliki sampel pengamatan T. Jika kita mengetahui simpangan baku yang
sebenarnya, kesalahan standarnya adalah s( b) = =p T maka ( b 0)=s( b) akan berdistribusi
2
normal. Tetapi ketika kita mengestimasi varians dengan s, estimasi standar errorsd(
kita) adalah
= s=p T :
Ini menambah ketidakpastian ekstra, dari tidak mengetahui ; dan ( b 0)=sd( ) mengikuti distribusi
lain yang disebut distribusi t, diperkenalkan
di atas, yang lebih menyebar. Seberapa jauh lebih menyebar tergantung pada derajat kebebasan:
T 1: Sebagai jumlah pengamatan, T; menjadi besar efek pendugaan varians menjadi lebih kecil
dan distribusi t mendekati distribusi normal. Untuk distribusi normal 95% dari distribusi terletak
pada rentang kesalahan standar 1:96. Untuk pada distribusi dengan 3 derajat kebebasan (n = 4)
95% terletak pada kesalahan standar 3:182; dengan 10 derajat kebebasan adalah 2:228; dengan
30 derajat kebebasan adalah 2:042: Tabel distribusi t diberikan di belakang buku teks statistik,
misalnya Tabel Barrow A3. Praktik di bidang ekonomi adalah menggunakan 2 sebagai nilai kritis
dan tidak menggunakan sampel yang sangat kecil. Sebagian besar program komputer
memberikan nilai p, probabilitas hipotesis nol benar, dan mungkin lebih nyaman untuk digunakan.
Pada tingkat 5% Anda menolak hipotesis nol jika nilai p < 0,05: Anda harus tahu apa itu hipotesis
nol.

Dalam pengujian ekonomi baru di atas kami menggunakan perkiraan standar deviasi dari
seluruh sampel, sehingga jumlah pengamatan yang digunakan dalam memperkirakan

108
Machine Translated by Google

variansnya besar dan kita bisa menggunakan distribusi normal. Jika kita telah menggunakan
perkiraan standar deviasi dari tahun 1990-an jumlah pengamatan
akan kecil, 9, dan kita harus menggunakan distribusi t.

16.4. Pengujian

Dalam pengujian kita mulai dengan apa yang disebut hipotesis nol, H0 : = nol karena 0: Itu disebut
dalam banyak kasus nilai hipotesis kita adalah nol, yaitu 0 = 0: Kami menolak
mendukung apa yang disebut hipotesis alternatif, H1 : 6= 0; jika ada
bukti yang sangat kuat terhadap hipotesis nol. Ini adalah alternatif dua sisi,
kami menolak jika perkiraan kami secara signifikan lebih besar atau lebih kecil. Kita juga bisa memilikinya
alternatif sisi < 0 atau > 0: Konvensi dalam ilmu ekonomi adalah menggunakan dua
alternatif sisi.
Masalahnya adalah bagaimana kita memutuskan apakah akan menolak hipotesis nol atau tidak
untuk menolak hipotesis nol. Dalam persidangan pidana, hipotesis nolnya adalah bahwa
terdakwa tidak bersalah. Juri hanya dapat menolak hipotesis nol ini jika buktinya
menunjukkan rasa bersalah tidak diragukan lagiî. Bahkan jika Anda berpikir terdakwa adalah
mungkin bersalah (lebih baik dari 50% kesempatan) Anda harus membebaskan, ini tidak cukup.
Dalam pengadilan perdata juri memutuskan 'pada keseimbangan bukti', tidak ada alasan
untuk mendukung satu keputusan daripada yang lain. Jadi ketika OJ Simpson diadili
pembunuhan, tuntutan pidana, juri memutuskan bahwa bukti tidak melampaui
keraguan yang masuk akal dan dia dibebaskan. Namun saat keluarga korban membawa
kasus perdata terhadapnya, untuk menuntut ganti rugi atas kematian, juri memutuskan
keseimbangan bukti bahwa dia melakukannya. Perbedaan ini mencerminkan fakta bahwa
kalah dalam perkara pidana dan kalah dalam perkara perdata memiliki akibat yang cukup berbeda.
Pada dasarnya masalah yang sama terlibat dalam pengujian hipotesis. Kami memiliki nol
hipotesis, terdakwa tidak bersalah. Kami memiliki hipotesis alternatif bahwa
terdakwa bersalah. Kita tidak akan pernah tahu mana yang benar. Ada dua kemungkinan
keputusan. Baik menerima hipotesis nol (membebaskan terdakwa) atau menolak
Hipotesis nol (dan terdakwa bersalah). Di Skotlandia juri memiliki sepertiga
kemungkinan putusan: tidak terbukti. Sebut hipotesis nol, H0; ini bisa jadi tergugat
tidak bersalah atau = 0. Maka kemungkinannya adalah

H0 benar H0 salah
Terima H0 Benar Kesalahan tipe II
Tolak kesalahan H0 Tipe I Benar

Dalam sidang pidana kesalahan Tipe I adalah menghukum orang yang tidak bersalah. Kesalahan tipe II
adalah membebaskan orang yang bersalah. Tentu saja, kita dapat menghindari kesalahan Tipe I sepenuhnya:

109
Machine Translated by Google

selalu menerima hipotesis nol: bebaskan semua orang. Tapi kami akan membuat banyak
kesalahan tipe II, membiarkan orang yang bersalah pergi. Atau kita bisa membuat kesalahan
tipe II nol, menghukum semua orang. Karena kita tidak tahu apakah hipotesis nol itu benar
(apakah OJ benar-benar tidak bersalah), kita harus menukar kedua risiko tersebut. Menerima
hipotesis nol hanya bisa bersifat tentatif, bukti ini mungkin tidak menolaknya, tetapi bukti di masa
depan mungkin.
Uji statistik merancang prosedur pengujian sehingga ada risiko tetap dari kesalahan Tipe I:
menolak hipotesis nol padahal hipotesis itu benar. Probabilitas ini biasanya tetap pada 5%,
meskipun ini hanya sebuah konvensi.
Jadi prosedur dalam pengujiannya
adalah 1. Tentukan hipotesis nol, = 2. 0:
Tentukan hipotesis alternatif 6= 0: 3. Rancang
statistik uji, yang hanya merupakan fungsi dari data yang diamati dan
hipotesis nol, bukan fungsi dari parameter yang tidak diketahui
b

= 0

SD()

4. Temukan distribusi statistik uji jika hipotesis nol benar. memiliki distribusi dalam sampel
distribusi normal dalam sampel besar. kecil (kurang dari Dalam hal ini statistik uji, , sekitar 30),

5. Gunakan distribusi untuk menentukan nilai kritis, sehingga probabilitas berada di luar nilai
b

kritis kecil, biasanya 5%.


6. Tolak null jika berada di luar nilai kritis, (dalam hal ini di luar rentang 2); jangan menolak
nol sebaliknya.
7. Pertimbangkan kekuatan tes. Kekuatan adalah probabilitas menolak hipotesis nol ketika
hipotesis itu salah (1 P(typeIIerror)), yang bergantung pada nilai parameter yang sebenarnya.

Dalam contoh medis, penyaringan penyakit, yang kami gunakan di bagian 11, kami juga
memiliki dua jenis kesalahan (positif palsu dan negatif palsu), dan kami harus menyeimbangkan
dua jenis kesalahan dengan cara yang sama. Di sana kami melakukannya atas dasar biaya dan
manfaat. Ketika biaya dan manfaat dapat dihitung, itulah cara terbaik untuk melakukannya.
Dalam kasus di mana biaya dan manfaat tidak diketahui, kami menggunakan uji signifikansi.

Signifikansi statistik dan signifikansi substantif bisa sangat berbeda. Efeknya mungkin sangat
kecil dan tidak penting, tetapi secara statistik sangat signifikan, karena kami memiliki sampel
yang sangat besar dan kesalahan standar yang kecil. Atau, efeknya mungkin besar, tetapi tidak
signifikan secara statistik karena kita memiliki efek yang kecil

110
Machine Translated by Google

sampel dan diperkirakan secara tidak tepat. Signifikansi statistik bertanya: bisakah
perbedaan muncul secara kebetulan dalam sampel sebesar ini?
penting?í
Ketika kami membahas interval kepercayaan, kami mengatakan bahwa interval kepercayaan 68%
adalah bs( b) : kisaran yang dicakup oleh perkiraan plus dan minus satu standar
kesalahan akan menutupi nilai sebenarnya, ; lebih dari dua pertiga waktu. Ada sebuah
godaan kuat untuk mengatakan bahwa probabilitas yang terletak dalam kisaran ini adalah dua
pertiga. Benar-benar ini salah, xed bukan variabel acak, jadi tidak ada
probabilitas yang melekat pada : Probabilitas melekat pada variabel acak
b

; yang berbeda dalam sampel yang berbeda. Statistik Bayesian tidak memperlakukan parameter
sebagai variabel acak, dengan beberapa distribusi probabilitas sebelumnya; menggunakan data
untuk memperbarui probabilitas; dan tidak menggunakan pendekatan Neyman-Pearson untuk
pengujian yang ditetapkan di atas.

16.4.1. Contoh ekuitas


b

Misalkan pengembalian riil rata-rata atas ekuitas selama T = 100 tahun adalah standar = 10%;
deviasi pengembalian riil s = 20% dan mereka muncul secara normal
didistribusikan (pada kenyataannya pengembalian ekuitas tidak cukup terdistribusi secara normal). Untuk
Variabel Acak Z mengikuti distribusi normal standar
z 0:5 1 1:5 2 2:5 3
P(Z < z) 0:6915 0:8413 0:9332 0:9772 0:9938 0:9987

(a) Jelaskan apa yang dimaksud dengan P(Z < z). Berapa P(Z < 0)?
(b) Berapakah kesalahan standar rata-rata?
(c) Apakah pengembalian rata-rata berbeda secara signifikan dari nol?
(d) Berapa probabilitas pengembalian kurang dari 50%?
(e) Berapa probabilitas pengembalian positif.
Menjawab.
(a) P(Z < z) adalah probabilitas bahwa variabel acak Z mengambil nilai lebih kecil
dari nilai tertentu, z. P(Z < 0) = 0:5 karena distribusi normal standar
simetris di sekitar nol, ada 50% di bawah nol dan 50% di atas.
(b) Kesalahan standar mean adalah s=p T = 20= p 100 = 2.
=
(c) Untuk menguji hipotesis, kita menggunakan rumus = ( b 0)=s( b); b = 10; 0 0; s( b) = 2: : =
(10 0)=2 = 5 lebih besar dari 2. Jadi mean return adalah
berbeda nyata dari nol. Kami menolak hipotesis nol yang diharapkan
pengembalian adalah nol pada (lebih baik dari) tingkat 5%.

111
Machine Translated by Google

(d) Probabilitas pengembalian kurang dari -50%? z=(ñ50-10)/20=-3. Distribusi simetris


sehingga P(Z < 3) = P(Z > 3) = 1 P(Z < 3) : Prob=1-0,9987=0,0013 atau 0,13% (e) Probabilitas
pengembalian positif: z=(0- 10)/20=-0,5; P(Z>-0,5)=P(Z <0,5)=0,6915 atau 69%.

Perhatikan pentingnya apakah kita menggunakan standar deviasi dari re


belokan atau kesalahan standar rata-rata =p T :

16.4.2. Contoh Latar Belakang: uji klinis

Uji klinis cenderung dilakukan dalam tiga fase. Fase I adalah percobaan kecil untuk menentukan
toksisitas dan dosis efektif. Tahap II adalah uji coba yang lebih besar untuk menentukan efektivitas.
Fase III adalah percobaan yang lebih besar untuk membandingkan keefektifan dengan
pengobatan alternatif, jika ada. Jika tidak ada pengobatan alternatif, pasien secara acak
ditempatkan pada kelompok perlakuan yang diberikan obat dan kelompok kontrol yang diberi
plasebo, dibuat agar terlihat seperti obat tersebut. Efek plasebo adalah kenyataan bahwa
pengobatan apa pun, betapapun tidak efektifnya, cenderung membuat pasien menjadi lebih baik,
jika mereka mempercayainya. Pengacakan penting karena jika tidak, kedua kelompok pasien
mungkin berbeda dalam cara yang mempengaruhi efek obat. Percobaan-percobaan tersebut
bersifat double blind dimana baik pasien maupun dokter tidak mengetahui apakah pasien
mendapatkan obat atau plasebo. Ini untuk menghentikan dokter memilih mereka yang dirawat,
misalnya memberikannya kepada mereka yang lebih sakit, yang akan membiaskan hasil
percobaan. Memberi beberapa orang plasebo yang tidak efektif menimbulkan masalah etika, tetapi
juga memberi yang lain obat yang belum dicoba dan berpotensi berbahaya. Sekali lagi kami
mencoba untuk menyeimbangkan dua jenis kesalahan.
Misalkan kita memiliki 100 pasien, 50 pada kelompok perlakuan, 50 pada kelompok kontrol;
18 dari kelompok perlakuan meninggal dalam jangka waktu tertentu, 22 dari kelompok kontrol
meninggal; apakah perbedaan ini signifikan?
Jawaban
Seperti yang kita lihat di atas, kesalahan standar untuk pendugaan suatu proporsi adalah se
(p)menaksir
= p pq=npb
di mana
= N=n n; di
adalah
manajumlah
N adalah
pengamatan
jumlah yang
yang
mati.
menjadi
Jumlah
dasarnya,
observasi
danpada
q = kelompok
p: Kami
1 perlakuan n1 = 50; seperti jumlah pada kelompok kontrol, n2: Perkiraan proporsi yang
meninggal adalah pb1 = 0.36; pb2 = 0:44: Jika jumlah pengamatan n1 dan n2 cukup besar,
perbedaan proporsi sampel pb1 dan pb1 akan mendekati normal dengan mean p1p2 dan varians

p1q1 p2q2
V (p1 p2) = +
n1 n2

112
Machine Translated by Google

di mana qi = 1 pi : Hipotesis nol kami adalah p1 p2 = 0: Jika hipotesis nol benar tidak ada
perbedaan, maka perkiraan terbaik kami untuk p = p1 = p2 adalah (18+22)/100=0,4. dan
kesalahan standarnya adalah

0:4 0:6 +
0:1
se(pb) = r 0:4 0:650 50

statistik pengujian kami adalah

pb1 pb2 0:36 0:44 =


= = 0:8
se(pb) 0:1

Ini kurang dari dua dalam nilai absolut, jadi kami tidak akan menolak hipotesis nol bahwa
proporsi yang meninggal adalah sama pada kelompok perlakuan dan kontrol.
Perbedaan bisa dengan mudah muncul secara kebetulan. Untuk memeriksa ini kita perlu
melakukan percobaan yang lebih besar. Barrow bab 7 membahas masalah ini.
Seharusnya tidak membuat perbedaan, tetapi dalam praktiknya bagaimana Anda membingkai
probabilitas, misalnya dalam hal proporsi yang mati atau proporsi yang bertahan hidup, dapat mempengaruhi
bagaimana orang merespons.

17. Regresi Bivariat

Sebagian besar penggunaan statistik dalam ekonomi dan keuangan (ekonometrika) melibatkan
pengukuran pengaruh satu variabel (misalnya harga) pada variabel lain (misalnya kuantitas
yang diminta). Regresi adalah alat statistik yang digunakan untuk mengukur efek.
Dalam hal ini harga akan menjadi variabel bebas atau regresi dan kuantitas yang diminta
sebagai variabel terikat. Barrow Bab 7 dan 8 membahas materi ini.

17.1. Contoh: CAPM.

Misalkan tingkat bunga bebas risiko selama suatu periode adalah Rt ; pengembalian tertentu dan

saham adalaht Ri
pengembalian di pasar saham (misalnya indeks FTSE atau S&P) adalah Rm t :
Pengembalian ini biasanya
Penetapan Harga diukur
Aset Modal sebagai
(CAPM) perubahan
dapat logaritma
ditulis sebagai dari harga saham. Model
regresi

saya

Rt Rt = + (R m t Rt) + ut

kelebihan pengembalian atas saham i sama dengan konstan (yang seharusnya nol) ditambah
koefisien kali kelebihan pengembalian di pasar, ditambah kesalahan acak atau

113
Machine Translated by Google

gangguan, yang mencerminkan faktor-faktor yang menggeser pengembalian saham i selain pergerakan
seluruh pasar. Risiko suatu saham diukur dengan ; jika = 1 sama fluktuatifnya dengan pasar; jika > 1;
itu lebih tidak stabil daripada pasar; jika < 1; itu kurang stabil daripada pasar. Semakin berisiko
saham, semakin tinggi pengembalian yang dibutuhkan relatif terhadap pengembalian pasar. Diberikan
t ; Rt dan Rm
data pada Ri untuk periode waktu t = 1; 2; :::; menentukan seberapa besar variasi pengembalian t;
T kami ingin memperkirakan dan untuk stok dan
saham dapat dijelaskan oleh variasi di pasar. Verbeek, bagian 2.7 membahas contoh ini secara lebih
rinci.

17.2. Contoh: Hubungan Nelayan

Tingkat bunga riil adalah tingkat bunga nominal Rt dikurangi tingkat inflasi t

rt = Rt t

misalkan tingkat bunga riil kira-kira konstan, sama dengan konstan ditambah kesalahan acak

rt = r + ut
maka kita bisa menulis
Rt = rt + t = r + t + ut :

Kemudian jika kita menjalankan regresi

Rt = + t + ut

teori mengatakan = r dan = 1; hipotesis = 1 dapat diuji. Interpretasinya adalah bahwa tingkat bunga
yang diharapkan rata-rata ketika tingkat inflasi adalah nol. memberi tahu Anda berapa banyak tingkat
bunga yang naik sebagai respons terhadap kenaikan inflasi sebesar poin persentase.

17.3. Menurunkan Penaksir Kuadrat Terkecil

Pada kedua contoh di atas, terdapat data, t = 1; 2; :::; T; dan model bentuknya

Yt = + Xt + ut ;

dan kami akan terus mengasumsikan bahwa ut adalah variabel acak dengan nilai harapan nol dan
2
varians dan pengamatan tidak berkorelasi
E(ututi) atau independen
= 0: Selanjutnya kita akan sepanjang waktu;bahwa
mengasumsikan yaitu E(ut) = 0, E(u ,
2 2
t )=

114
Machine Translated by Google

variabel bebas bervariasi, V ar(Xt) 6= 0; dan tidak bergantung pada kesalahan sehingga
kovarians antara keduanya adalah nol Ef(Xt E(Xt))utg = 0: Jika kita dapat memperkirakan
b
b

dan ; oleh dan ; maka kita dapat memprediksi Yt untuk setiap nilai tertentu dari X:
b

Ybt = + Xb t

ini disebut nilai tted atau prediksi dari variabel dependen. Kita dapat
juga memperkirakan kesalahan:

ubt = Yt Ybt = Yt ( b + Xbt )

ini disebut residu. Perhatikan kita membedakan antara yang benar-benar tidak teramati
kesalahan, ut ; dan residu, serta perkiraan kesalahan.
Seperti nilai yang diharapkan di atas ada dua prosedur yang akan kita gunakan untuk
turunkan taksiran, metode momen, dan kuadrat terkecil.

17.3.1. Metode Momen

Dua asumsi populasi kami (kondisi momen) adalah bahwa nilai yang diharapkan dari
kesalahan adalah nol, E(ut) = 0 dan kovarians dari variabel independen dan kesalahan
adalah nol: Ef(Xt E(Xt)utg = 0: Kami memilih perkiraan kami jadi
bahwa ekuivalen sampel dari persamaan ini benar. Contoh ekuivalen dari
E(ut) = 0 adalah rata-rata dari galat yang diestimasi adalah nol

1
T ubtg = T
fX
t 1 (X t (Yt b Xb t) ) = 0

T Yt T Yt Xt) = 0
b bX bb(T 1X
1 (X t t Xt ) = T 1X t t
b

= Y bX
b

Kondisi momen pertama kita menyiratkan bahwa perkiraan adalah rata-rata dari Y
b b

minus adalah, tetapidari


kali mean selama kita belum tahu cara ini, kesalahan
X: Kami b
b

deÖne akan berjumlah nol, berapa pun nilai : ke dalam persamaan yang Kita dapat
b

substitusikan perkiraan ini dari diperkirakan


b

Yt = + Xb t + ubt = Y bX + Xb t + ubt

yang bisa kita tulis


Yt Y = b(Xt X) + ubt

115
Machine Translated by Google

menggunakan huruf kecil untuk menunjukkan penyimpangan dari mean, ini.

yt = xb t + ubt (17.1)
b

Kami menggunakan ini untuk menemukan : Contoh ekuivalen dari kondisi momen kedua kita:
Ef(Xt E(Xt)utg = 0 adalah

T 1X xtub = 0
t

xtyt 2x
T 1X xt(yt xb t) = T 1X
t t b ( T 1X t t)=0
b

2x 2x

= ( T 1X xtyt t) = ( T 1X t t ) = (X t xtyt ) = (X t t ):
b

Ini mengatakan bahwa perkiraan kami adalah rasio kovarians (populasi) dari Xt ; (ingat
varians dari Xt berarti). huruf kecil menunjukkan penyimpangan dari dan Yt ke

17.3.2. kuadrat terkecil


b

Seperti nilai yang diharapkan, kita juga dapat menemukan yang meminimalkan Pubt2; di mana
dari (17:1)

2
ub2 xb t 2 + b 2X xtyt
X t =X yt =X kamu
t 2 xt 2bX
t t t t t
b

2 dengan hormat
turunan dari pub t
adalah

@ Pubt2
b
= 2bX 2 xt 2X xtyt = 0 (17.2)
@
t t
b b

Menulis ini 2 P = 2P t xtyt dan membagi kedua ruas dengan 2 P seperti


=
2 x ; memberi
t 2 xt tt
P t xtyt= P t 2xt ;
__
sebelumnya:
Syarat orde kedua adalah

@2 pub 2
b2
t
= 2Xx 2 >0 (17.3)
t
@

116
Machine Translated by Google

karena kuadrat positif, jadi ini adalah minimum.


Perkiraan kami
b

= Y bX
b

= P(Xt X)(Yt Y )
P(Xt X) 2

(i) membuat jumlah residu yang diestimasi menjadi nol dan residu yang diestimasi
tidak berkorelasi dengan variabel penjelas dan (ii) meminimalkan jumlah residu
kuadrat.

17.4. Sifat perkiraan

Sejak
b

= P xtyt 2 = Pxt( xt + ut) P xtut


x =+
P t Px 2 t P 2 xt

maka E(b) = ; dan itu tidak bias; sejak karena kemerdekaan

P xtut P xt
E =E E(ut)
P 2 xt P 2 xt

b b

dan E(ut) = 0: Untuk menurunkan varians dari ; perhatikan sejak tidak bias

2
b
2 P xtut 2
=
V (b) = E( ) = E( 2 xt
) 2 (17.4)
P Px t

menggunakan jenis argumen yang sama seperti dalam menurunkan kesalahan standar rata-rata
di atas.

17.5. Mengukur seberapa baik regresi ts

Perhatikan jika kita mendefinisikan kovarians antara X dan Y : Sxy = P(Xt X)(Yt b

Y )=T, dan varians Sxx = P(Xt X) 2=T, maka = Sxy=Sxx seperti yang kita lihat di
atas dan koefisien korelasinya adalah:
r= Sxy
p SxxSyy
seperti yang kita lihat di bagian 6. Koefisien korelasi terletak antara -1 (hubungan negatif
sempurna) dan +1 (hubungan positif sempurna) dengan 0 menunjukkan tidak ada hubungan linier.

117
Machine Translated by Google

Perhatikan bahwa kovarians dan korelasi hanya mengukur hubungan linier. Anda bisa
memiliki hubungan non-linier yang tepat (misalnya lingkaran) dan korelasinya akan
2
menjadi nol. Dalam regresi kita menggunakan kuadrat dari koefisien korelasi, r biasanya ,
ditulis R2 dan disebut koefisien determinasi. Ini memberi Anda proporsi variasi dalam Y
yang telah dijelaskan oleh regresi.
Kami mengukur dispersi di sekitar garis dengan cara yang persis sama dengan kami
mengukur dispersi di sekitar rata-rata, baik menggunakan penaksir bias
b2
= xub 2 t =T

atau penaksir tak bias


2

= xub 2 t =(T2)
detik

b Xb di ada T 2 derajat kebebasan karena kami memperkirakan dua


mana ubt = Yt t : Sekarang b
b
2
parameter yang disebut varians dan
dari :regresi
perkiraan s
dan akar kuadratnya
Regresis,(SER),
Kesalahan
yangStandar
memberi
Anda gambaran tentang ukuran rata-rata kesalahan. SER diukur dalam satuan yang
sama dengan variabel terikat. Jika variabel dependen adalah logaritma, SER dapat
dikalikan dengan 100 dan diinterpretasikan sebagai persentase kesalahan. Kami
kemudian dapat mengukur kesalahan standar dengan memasukkan estimasi (17:4) dan
b

mengambil akar kuadrat. sebagai se(b) = s=pPx 2t

Koefisien determinasi; atau R kuadrat, proporsi variasi Y yang telah dijelaskan, atau
1 dikurangi proporsi variasi Y yang belum dijelaskan. didefinisikan sebagai

2
pub t
R2 = 1
P (Yt Y ) 2
b

Tunjukkan bahwa ini sama dengan 2 didefinisikan di atas. Jika = 0; maka tidak ada yang terjadi
b

r yang dijelaskan: ubt = Yt b, di mana hanya mean dan R2 = 0: Paket


2
komputer juga sering menghitung disesuaikan R2 atau R (R bar kuadrat).
Ini mengoreksi pembilang dan penyebut untuk derajat kebebasan:
2
2 pub t =(Tk)
R =1
P(Yt Y ) 2=(T 1)

di mana k adalah jumlah variabel penjelas, termasuk intersep. Ini bisa menjadi negatif.

118
Machine Translated by Google

Dari perkiraan kami, kami juga dapat menghitung nilai prediksi Y untuk X tertentu:
b

Ybt = + Xb t

dan sisa atau bagian Y yang tidak dapat dijelaskan untuk pengamatan tertentu adalah:

ubt = Yt Ybt = Yt ( b + Xbt )

17.6. Asumsi untuk Kuadrat Terkecil untuk memberikan perkiraan yang baik

Kami berasumsi:
Bahwa kita memiliki model yang benar untuk proses tersebut, misalnya linier dan kita
tidak meninggalkan variabel yang relevan.
Bahwa nilai kesalahan yang diharapkan adalah nol: E(ut) = 0, rata-rata
kesalahan yang benar adalah nol. Perhatikan bahwa rata-rata residual kami selalu nol,
1
(T Pubt = 0 dengan konstruksi), selama kita memiliki intersep dalam persamaan
atau bekerja dengan penyimpangan dari mean.
2 2
E itu (u t )= , kesalahan memiliki varians yang konstan. Asumsi ini terkadang
menyatakan kesalahannya homoskedastis (variansnya sama), kegagalannya
adalah bahwa kesalahannya heteroskedastis (variansnya berbeda).
E(ututi) = 0; untuk i 6= 0. Kesalahan yang berbeda adalah independen. Asumsi ini adalah
juga disebut: tidak ada korelasi serial atau tidak ada autokorelasi.
2
b
P(XtX) itu 6= 0; X harus bervariasi pada sampel. Kita tidak bisa menghitung
jika ini tidak terjadi. Ini juga akan gagal jika tidak ada cukup pengamatan
untuk memperkirakan parameter. Kita membutuhkan T > 2. Jika T = 2; kita tidak bisa melakukan pengamatan
tepat oleh garis yang melalui dua titik.
Bahwa Ef(Xt E(Xt)utg = 0. Asumsi ini biasanya digambarkan sebagai
X bersifat eksogen: tidak terkait dengan kesalahan. Perhatikan bahwa untuk perkiraan kami
T 1 P t (Xt X)ubt = 0 dengan konstruksi. Untuk eksogenitas, X mungkin juga
menjadi non stokastik, angka tetap, meskipun ini jarang terjadi dalam ekonomi di mana X kita
variabel biasanya acak atau variabel acak didistribusikan secara independen dari
kesalahan. Independensi menyiratkan bahwa X dan kesalahan tidak berkorelasi, tetapi a
asumsi yang lebih kuat daripada tidak berkorelasi.
Sifat estimator dibahas pada bagian 15.3. Dengan semua asumsi ini kita dapat
menunjukkan bahwa di antara semua estimator dari dan itu adalah fungsi linier
dari Y dan tidak bias; estimator kuadrat terkecil memiliki varians terkecil. Ini
adalah teorema Gauss-Markov: berdasarkan asumsi-asumsi ini, penduga kuadrat terkecil
adalah Penaksir Tak Bias Linier Terbaik (varian minimum), yaitu BIRU. Jika di

119
Machine Translated by Google

Selain itu kami menambahkan asumsi lain ke model, bahwa kesalahan terdistribusi secara
normal, maka perkiraan kami juga akan terdistribusi secara normal dan kami dapat
menggunakan ini untuk membangun statistik uji untuk menguji hipotesis tentang koefisien regresi.
Bahkan jika kesalahan tidak terdistribusi secara normal, dengan teorema limit pusat
perkiraan kami akan terdistribusi secara normal dalam sampel besar; dengan cara yang
sama bahwa rata-rata terdistribusi secara normal apa pun distribusi variabel dalam sampel
besar.
Kita membutuhkan asumsi bahwa X adalah eksogen, untuk membuat pernyataan kausal
tentang pengaruh X pada Y: Ketika kita hanya tertarik untuk memprediksi tinggi- , seperti pada
berat Y contoh, kita tidak memerlukan asumsi eksogenitas dan mendapatkan hasil bahwa
prediksi kuadrat terkecil Ybt adalah Linear Terbaik (varian minimum)
Prediktor Tidak Bias dari Yt :

17.7. Nilai dan residu yang diprediksi.

Kami berasumsi bahwa ada model yang benar atau proses menghasilkan dataî seperti yang
b

= + Xt + ut . Kami memperkirakan Yt = Jadi prosedur kuadrat kadang-kadang


terkecil Ybt ++ubt
Yt = membagiXbYt.t disebut:
+menjadi
ubt atau
Yt
dua bit, bit yang dijelaskan, nilai yang diharapkan atau diprediksi, dan bit yang tidak dapat
dijelaskan, sisa, ubt . Disebut residual karena sedikit yang tersisa setelah kami menjelaskan
semua yang kami bisa. Nilai prediksi adalah perkiraan ekspektasi bersyarat untuk Y
bersyarat pada X: Ybt = E(Yt j Xt) =
b

+ Xb t :
Perhatikan bahwa nilai prediksi dan residu tidak berkorelasi, kovariansnya tepat nol:

X Ybt = X( b + Xb t)ubt = b Xubt + bXXtubt


t=1

Tetapi kondisi momen kami adalah bahwa Pubt = 0 dan estimasi kuadrat terkecil dipilih
untuk membuat ini benar, sehingga suku pertama adalah nol, sedangkan kondisi momen
kedua kami adalah PXtubt = 0, sehingga suku kedua juga nol. Jadi nilai prediksi atau nilai
tted tidak berkorelasi dengan residual yang diestimasi. Salah satu kegunaan utama dari nilai
prediksi adalah dalam peramalan, kami membuat asumsi tentang bagaimana X akan
berubah di masa depan, menggunakan persamaan untuk meramalkan Y dan menghitung
kesalahan standar untuk peramalan.
Dengan konstruksi residu memiliki mean nol (jika ada intersep, yaitu dalam persamaan,
; dan Anda harus selalu menyertakan intersep) dan mereka tidak berkorelasi dengan
variabel penjelas. Tapi kita bisa memeriksa apakah yang lain

120
Machine Translated by Google

asumsi yang kami buat tentang kesalahan yang berlaku untuk estimasi residual. Kita dapat menguji
2 2
apakah asumsi kita bahwa konstanta E(ua, berlaku
t ) = dalamE(ututi)
data. Kita
= 0;juga
karena
dapat
i tidak
menguji
samaapakah
dengan
0. Ini adalah asumsi independensi, atau tidak ada korelasi serial atau tidak ada autokorelasi. Kita
mungkin juga berasumsi bahwa ut terdistribusi normal dan kita dapat menguji apakah skewness
dan kurtosis dari residual adalah variabel terdistribusi normal.Kita akan membahas bagaimana kita
menguji asumsi ini nanti, tetapi dalam banyak kasus cara terbaik untuk memeriksanya adalah
dengan melihat gambar nilai aktual dan prediksi serta residu. Residu harus terlihat acak, tanpa pola
yang jelas di dalamnya dan histogram akan terlihat kira-kira normal.

Apa yang Anda lakukan jika Anda memiliki residual yang tidak sehat, yang menunjukkan
korelasi serial atau heteroskedastisitas? Buku teks cenderung menyarankan agar Anda memodelkan
gangguan, biasanya dengan prosedur yang disebut Kuadrat Terkecil Umum. Namun, dalam
kebanyakan kasus masalahnya bukanlah bahwa gangguan yang sebenarnya adalah heteroskedastis
atau berkorelasi serial. Masalahnya adalah Anda mendapatkan model yang salah, dan kesalahan
dalam cara Anda menentukan model muncul dalam estimasi residual.
Pemodelan gangguan seringkali hanya mengobati gejalanya, solusinya adalah menyembuhkan
penyakitnya: mendapatkan model yang ditentukan dengan benar.

18. Regresi Berganda.


18.1. Contoh dan model logaritma

Sebagian besar waktu kami memiliki lebih dari satu variabel sisi kanan, jadi regresi kami mungkin
merupakan fungsi permintaan seperti

ln Qt = + Dalam Yt + Di Pt + di P + ut (18.1)
1 2 3 4 t

di mana Qt adalah kuantitas yang diminta, Yt pendapatan riil dan Pt harga barang, P ukuran t
sebuah

harga semua barang lain, dan ln menunjukkan logaritma natural. Diberikan adalah elastisitas
kemudian dalam permintaan2sebagai
pendapatan
respons
dariterhadap
permintaan
satu
(persentase
persen perubahan
mengubah
pendapatan),
persamaanyang
log
kita harapkan positif, dan elastisitas harga sendiri, yang kita harapkan negatif dan elastisitas harga
silang, yang untuk semua3 barang lainnya
logaritma harus
variabel positif. karena
ekonomi Merupakan standar
(a) harga danuntuk menggunakan
kuantitas tidak negatif
4 sehingga log didefinisikan (b) koefisien dapat diinterpretasikan sebagai elastisitas, sehingga
unit pengukuran variabel tidak menjadi masalah ( c) dalam banyak kasus kesalahan sebanding
dengan variabel, sehingga varians lebih mungkin

121
Machine Translated by Google

agar logaritma konstan, (d) logaritma variabel ekonomi seringkali mendekati distribusi normal (e)
perubahan logaritma kira-kira sama dengan laju pertumbuhan dan (f) banyak hipotesis menarik
yang dapat diuji dalam model logaritma . Misalnya dalam kasus ini jika 4 (homogenitas derajat
= non-linear
nol) hanya harga relatif yang penting. Perhatikan model aslinya
3

Qt = OLEHt 2 P3t _ hal 4


t exp(ut)

dimana B = exp( 1 ); tetapi dapat dibuat linier dengan mengambil log.


Model logaritma umum lainnya adalah fungsi produksi Cobb-Douglas
menjelaskan keluaran pada waktu t Qt ; dengan modal Kt dan tenaga kerja Lt dan kesalahan

c e dt+ut
Qt = AKb tL t

Perhatikan output akan menjadi nol jika modal atau tenaga kerja adalah nol. Kita dapat membuat
linear ini dengan mengambil logaritma

ln Qt = ln A + b ln Kt + c ln Lt + dt + ut : (18.2)

Laju pertumbuhan kemajuan teknis diukur dengan d; ini adalah jumlah keluaran log yang berubah
antar periode jika semua masukan konstan: ut residual sering diperlakukan sebagai ukuran
efisiensi, seberapa banyak keluaran yang lebih tinggi atau lebih rendah dari yang Anda harapkan.

Jika b + c = 1 ada skala hasil konstan: jika kedua input naik 10%,
output naik 10%. Kita dapat menguji ini dengan menulis ulang persamaan

ln Qt ln Lt = ln A + b [ln Kt ln Lt ] + (b + c 1) ln Lt + dt + ut (18.3)

dan dilakukan pada uji koefisien ln Lt yang seharusnya


; tidak berbeda nyata dengan nol jika
terdapat skala hasil konstan. Pemberitahuan (18:2) dan (18:3) adalah persamaan statistik yang
identik, misalnya perkiraan residu akan identik.

18.2. Bentuk Matriks Model Regresi Linier

Kita bisa menulis (18:1)

Yt = 1 + 2X2t + 3X3t + 4X4t + ut

dimana variabel terikat Yt berhubungan dengan ln Qt ; X1t adalah variabel yang selalu
mengambil nilai satu sehingga kita tidak perlu menuliskannya, X2t berkorespondensi dengan ln ,Yt dan

122
Machine Translated by Google

X3t ke ln Pt ; X4t ke ln P t : Soalnya sama seperti sebelumnya. Kami ingin menemukan i = 1; 2; 3; 4 yang
perkiraan dari 2
saya ; meminimalkan jumlah residu kuadrat, Pub t:

b b b b

2
Xub 2 t = X(yt 1 2X2t 3X3t 4X4t)

kita harus mengalikan suku-suku dalam kurung dan mengambil penjumlahan di


samping dan menurunkan kondisi orde pertama, turunan terhadap empat parameter.
Ini mengatakan bahwa residu harus berjumlah nol dan tidak berkorelasi keempat
Xit : Rumusnya, dinyatakan sebagai penjumlahan yang rumit. Jauh lebih mudah
untuk mengekspresikannya dalam bentuk matriks. Verbeek Lampiran A mengulas
aljabar matriks.
Kita dapat menulis ini adalah bentuk vektor

Yt = 0Xt + ui

di mana dan Xi adalah 4 1 vektor, jadi hasil kali 0Xi adalah (1 4) (4 1) = 1 1 skalar, sama seperti Yi .

Kita juga dapat menulis ini dalam bentuk matriks dalam bentuk vektor ya T 1 dan X a
matriks T4

Y1 1 X21 X31 X41 1 u1


2 3 2 32 3 2 3
Y2 = 1 X22 X32 X42 3 u2
6

6
7

7
6

6
7

7
6

6
7

7
+ 6

6
7

: : : : : :
3
4 YT 5 4 1 X2T X3T X4T 5 4 4 5 4 uT 5

kamu
=
X kamu

+
(T 1) (T 4) (4 1) (T 1) :

Ini memberi kita satu set persamaan T. Pemberitahuan, secara tertulis Xit; kami
telah berangkat dari konvensi aljabar matriks biasa memiliki subskrip pergi kolom
baris. Ini digeneralisasikan untuk kasus di mana X adalah matriks T k dan vektor
ak 1, berapa pun k: Perhatikan bahwa untuk produk matriks, angka-angka di dalam
harus cocok agar dapat selaras dan dimensi produk diberikan oleh angka-angka luar.

18.3. Asumsi

Kami sekarang ingin mengungkapkan asumsi kami tentang kesalahan dalam bentuk matriks. Asumsinya adalah: (a)
bahwa E(ut) = 0, rata-rata kesalahan sebenarnya adalah nol; (b) bahwa kesalahan E(u memiliki varians yang konstan;
2 2
dan (c) E(ututi) , i 6= 0;
t ) == 0; untuk

123
Machine Translated by Google

kesalahan yang berbeda adalah independen. Yang pertama adalah bahwa nilai yang
diharapkan dari vektor acak T 1 u adalah nol E(u) = 0: Untuk menangkap asumsi kedua dan
ketiga, kita perlu menentukan matriks kovarians varians dari kesalahan, E(uu0 ) a TT
0
matriks. u adalah transpos dari u;
baris
vektor
dan1sebaliknya.
T. Operasi Catatan
transposumengubah
0u adalah kolom
skalar,menjadi
1 1 jumlah
kesalahan kuadrat. Menulis E(uu0 )dan memasukkan asumsi kita ke dalam:

2
E(u 1 ) E(u1u2) :: E(u1uT )
2 2 3
E(u1u2) E(u 2 ) :: E(u2uT )
E(uu0 ) =
6 7

6 7

:: :: :: ::

2
4 E(u1uT ) E(u2uT ) :: E(u T ) 5
2
0 :: 0 :: 0
2 2 3
0
= 6 7

6 7

:: :: :: ::

2
4 0 0 :: 5

2
Jadi asumsi kami mengatakan bahwa E(uu0 ) = IT : Dimana IT adalah matriks identitas TT
dengan satu di diagonal dan nol di o diagonal.
Asumsi bahwa X eksogen, terdistribusi secara bebas dari kesalahan, u; menyiratkan
E(X0u) = 0; yang sesuai dengan asumsi kami sebelumnya E(XtX)ut = 0: Kami juga
mengasumsikan bahwa X memiliki peringkat penuh k: Ini menyiratkan bahwa regressor
yang berbeda bervariasi secara independen, tidak berkorelasi sempurna, dan sesuai dengan
asumsi kami sebelumnya bahwa Xt .varies .
b

18.4. Memperkirakan

Seperti sebelumnya, kita akan mempertimbangkan dua metode untuk menurunkan metode
penduga momen dan kuadrat terkecil. Kali ini untuk model y = X+ u; di mana y dan u adalah
vektor T x1, adalah vektor ak 1 dan matriks X a T k.

124
Machine Translated by Google

18.4.1. Metode momen

Asumsi eksogenitas kami adalah E(X0u) = 0; ekivalen sampel adalah X0ub = 0, ak 1 himpunan
persamaan, yang untuk kasus k = 4 di atas, memberikan

Xubt = 0;

XX2tub = 0;

XX3 tubt = 0;

XX4tub = 0:

Jadi
b
0 0
X 0ub = X (y Xb) = X y X 0X = 0:
1
Karena X adalah peringkat k; (X0X) ada (X0X adalah non-tunggal, determinannya adalah
bukan nol) jadi b

= (X 0X) 1X 0 aku:

18.4.2. kuadrat terkecil

Jumlah residu kuadrat adalah

ub 0ub = (y Xb) 0 (y Xb)


b0 b b0
0 0
=y y+ X 0X 2 X kamu

Untuk menurunkan estimator kuadrat terkecil, kami mengambil turunan, dan menetapkannya sama
dengan nol. Jika adalah vektor ak 1 kita mendapatkan k turunan, kondisi orde pertama adalah
himpunan persamaan k 1,

@ub 0ub b

b = 2X 0X 2X 0 y = 0
@

Bandingkan ini dengan (17:2): Jadi penaksir kuadrat terkecil adalah = (X0X) 1X0 y
1
sebagaimana
sebelumnya. Sekali lagi asumsi kami memastikan bahwa kondisi (X0X) adanya Orde kedua
adalah
@ 2ub 0ub
= 2X 0X
@@bb 0

yang merupakan matriks definit positif, memastikan minimum. Bandingkan ini dengan (17:3):

125
Machine Translated by Google

19. Sifat Kuadrat Terkecil


Kita dapat menurunkan nilai yang diharapkan dari b.
b

= (X 0X) 1X 0 y = (X 0X) 1X 0 (X+ u)


= (X 0X) 1X 0X + (X 0X) 1X 0u = + (X 0X) 1X 0u

Jadi
b

= + (X 0X) 1X 0u (19.1)

E(b) = + E((X 0X) 1X 0u) karena

bukan variabel acak, dan jika X dan u bebas E((X0X) 1X0u) = b

E((X0X) 1X0 )E(u) = 0 karena E(u) = 0: Jadi E(b) = dan adalah es ubiased
timator dari :
Dari (19.1) kita punya b

= (X 0X) 1X 0u
b

Matriks varians-kovarians dari adalah

b b b
0

E( Surut E(b))0 = E( )( )
b

sejak tidak bias. Tapi dari (19.1) kita punya


b

= (X 0X) 1X 0u

jadi

b b
0

E( )( ) = E((X 0X) 1X 0u)((X 0X) 1X 0u) 0


1
= E((X 0X) 1X 0u u0X(X 0X)
1
= (X 0X) 1X 0E(u u0 )X(X 0X)
= 2 1
(X 0X) 1X 0X (X 0X)
= 2 1
(X 0X)

2 2
karena E(uu0 ) = SAYA; adalah skalar, dan (X0X) 1X0X = I: Bandingkan dengan (17:4)
di atas.
2
Jika kita juga mengasumsikan normalitas maka kita dapat menulis bahwa u N(0; I): Fungsi linier dari
variabel yang terdistribusi normal juga normal. Kami melihat bahwa jika satu

126
Machine Translated by Google

2
variabel Y terdistribusi normal dengan mean fungsi Y ; dan varians . Maka setiap linier
juga terdistribusi normal.
2
YN ;

X = a + oleh N a + b ;
b2 2

dimana a dan b adalah skalar. Ekivalen matriks ini adalah bahwa, untuk k 1 vektor, Y dan M dan matriks
kk (bukan tanda penjumlahan) YN (M; ); maka untuk h 1 vektor X dan A; dan hk matriks B

X = A + BY N (A + BM; BB )

Perhatikan matriks kovarians varians dari X katakan V (X) = B B0 adalah (hk) (kk) (kh) = hh: Karena
y adalah fungsi linier dari u, maka y juga terdistribusi normal: = (X0X) 1X0 y adalah y N(X; I): Dalam
hal ini B adalah matriks identitas. Karena fungsi linier dari y, itu juga terdistribusi normal. b
2

b
2 1
N((X 0X) 1X 0X ;(X 0X) 1X 0 IX(X 0X)
2 1
N(; (X 0X) )
1
dalam hal ini A adalah nol, B = (X0X) 1X0 : (X0X) sama dengan transposnya karena
merupakan matriks simetris. (X0X) 1X0X = I: Ini
b

mengatakan bahwa tidak bias)


terdistribusi dan dengan
normal matriksnilai yang diharapkan (dan karena itu
2 1
kovarians varians Matriks varians kovarians adalah(X0X) :

matriks akk dan kami memperkirakannya dengan


2 1
V (b) = s (X 0X)
2 2 1
dimana = ub 0u=b (T k): Akar kuadrat dari elemen-elemen diagonal dari s memberikan (X0X)
yang
kesalahan standar dari perkiraan elemen individu yang dilaporkan oleh program komputer: ;

19.1. Variabel yang dihilangkan

Ketika Anda menambahkan variabel lain, perkiraan koefisien X umumnya akan berubah.

Nyatakan data dalam penyimpangan dari mean, untuk menghilangkan semua suku konstan.
Misalkan kita pertama hanya memasukkan xt ; meninggalkan zt dan mendapatkan perkiraan:

yt = bxt + vt : (19.2)

127
Machine Translated by Google

Kemudian kami menjalankan regresi lain yang mencakup zt :

yt = xt + zt + ut (19.3)

Kami mendapatkan dua perkiraan koefisien pada xt : b dan . Apa hubungan di antara mereka?
Untuk memahami hal ini kita perlu melihat hubungan antara xt dan zt . Kita dapat meringkas
hubungan antara xt dan zt dengan persamaan regresi lain:

zt = dxt + t (19.4)

wt hanyalah sedikit dari zt yang tidak berkorelasi dengan xt . d mungkin nol, jika tidak ada
hubungan. Masukkan (19:4) ke (19:3) dan kita dapatkan (19:2):

yt = xt + (dxt + berat) + ut

yt = (+ d)xt + ( berat + ut)

Jadi b = (+ d); koefisien xt mengambil bit zt yang berkorelasi dengan xt : Bit-bit zt yang
tidak berkorelasi dengan xt berakhir dalam error term ( wt +ut). Inilah sebabnya mengapa
mencari pola dalam istilah kesalahan itu penting, mungkin menyarankan variabel apa
yang Anda tinggalkan. Jika Anda menambahkan variabel yang tidak berkorelasi dengan , xt ,
koefisien xt tidak akan berubah. Jika Anda menambahkan variabel yang sangat berkorelasi
dengan xt
, koefisien xt akan banyak berubah.

20. Tes dalam regresi

20.1. Tes untuk hipotesis tunggal pada koefisien individu

Misalkan kita memiliki model

Yt = + Xt + Zt + ut

kita dapat menguji signifikansi masing-masing koefisien menggunakan rasio t persis seperti yang
kita lakukan untuk rata-rata b

t(= 0) = b

se
b b

dimana se adalah kesalahan standar yang diperkirakan dari: Ini menguji hipotesis nol

H0 : = 0: Jika rasio t ini lebih besar dari dua dalam nilai absolut, kita simpulkan bahwa

128
Machine Translated by Google

signifikan: berbeda nyata dari nol pada taraf 5%. Komputer sering
mencetak rasio t ini secara otomatis. Mereka biasanya memberikan koefisien, standar
kesalahan, rasio t dan nilai p. Nilai p memberi Anda probabilitas bahwa
hipotesis nol benar. Jika kurang dari 0,05, kita akan menolak hipotesis pada
tingkat 5%.
Kita bisa menguji terhadap nilai-nilai lain dari nol. Misalkan teori ekonomi menyarankan
bahwa = 1 statistik t untuk pengujian ini adalah
b

1
t( = 1) = se
( b)
b

dan jika statistik t ini lebih besar dari dua dalam nilai absolut, kami menyimpulkan bahwa adalah

berbeda secara signifikan dari kesatuan pada tingkat 5%.

20.2. Tes pada hipotesis bersama

Misalkan kita ingin menguji hipotesis bahwa tidak ada yang bebas
variabel memiliki efek apapun pada variabel dependen di

Yt = 1 + 2X2t + 3X3t + 4X4t + ut :


=
Hipotesisnya adalah bahwa = 0:2 Statistik=
3 uji yang
4 digunakan untuk menguji joint
hipotesis mengikuti distribusi yang berbeda yang disebut distribusi F, diperkenalkan pada
bagian 12.2. Sama seperti distribusi t dijelaskan oleh derajat kebebasannya,
distribusi F dijelaskan oleh derajat kebebasannya, meskipun memiliki dua
mereka. Yang pertama adalah jumlah hipotesis yang diuji, tiga dalam hal ini, dan
yang kedua adalah derajat kebebasan, T 4 dalam hal ini. Ini akan ditulis
F(3; T 4) dan nilai kritis diberikan dalam buku statistik: Statistik F untuk ini
hipotesis (bahwa semua koefisien kemiringan sama dengan nol) sering dicetak
oleh komputer, mereka juga biasanya memberikan nilai ap. Dengan nilai p yang tidak Anda miliki
untuk mencari tabel, tolak saja hipotesis nol jika p < 0.05: Perhatikan bahwa joint
hipotesis bahwa kedua koefisien sama dengan nol dapat memberikan kesimpulan yang berbeda
dari urutan hipotesis individu yang masing-masing sama dengan nol, mereka adalah
menguji hipotesis yang berbeda.

20.3. Tes Diagnostik untuk asumsi kami tentang kesalahan.

Jika asumsi kami tentang kesalahan valid, estimasi residual harus


terdistribusi normal dan acak: tanpa pola apa pun di dalamnya, jadi hipotesis nol kami adalah
bahwa model terspesifikasi dengan baik dan tidak ada pola dalam residual,

129
Machine Translated by Google

misalnya variabel lain seharusnya tidak dapat menjelaskannya. Hipotesis alternatif kami
adalah bahwa model tersebut salah ditentukan dengan cara tertentu, dan karena ada banyak
cara model dapat salah ditentukan (kesalahan bisa berhubungan secara serial,
heteroskedastis, non-normal atau model bisa non-linear. ) ada banyak tes ini, masing-masing
menguji nol yang sama, model dispesifikasikan dengan baik, terhadap alternatif tertentu
yang misspesifikasinya mengambil bentuk tertentu. Ini seperti fakta bahwa ada banyak tes
diagnostik berbeda yang digunakan dokter.
Ada banyak cara yang berbeda bahwa seseorang, atau kemunduran, bisa sakit.
Tes Durbin-Watson untuk korelasi serial adalah tes diagnostik untuk serial
korelasi. Ini diberikan oleh
2
DW = PT t=2(ubt ubt1)
PTt=1 ub 2
t

seharusnya sekitar 2; katakan 1:5 hingga 2:5: Jika di bawah 1:5 ada korelasi serial positif,
residu berkorelasi positif dengan nilai sebelumnya (tertinggal), di atas 2:5 korelasi serial
negatif. Ini hanya tepat jika (a) Anda tertarik pada korelasi serial orde pertama; (b) ada
intersep dalam persamaan, sehingga jumlah residu menjadi nol dan (c) tidak ada variabel
terikat yang tertinggal dalam persamaan.
Korelasi serial orde pertama (satu lag) mengasumsikan bahwa kesalahan terkait dengan
nilainya pada periode sebelumnya

ut = ut1 + "t

tetapi mungkin ada korelasi serial tingkat tinggi. Contohnya,. dalam data triwulanan,
kesalahan mungkin terkait dengan kesalahan hingga satu tahun yang lalu: ukuran kesalahan
dalam persamaan alkohol pada Natal (Q4) tidak hanya terkait dengan kesalahan kuartal
sebelumnya tetapi dengan ukuran kesalahan Natal lalu:

ut = 1ut1 + 2ut2 + 3ut3 + 4ut4 + "t

ini adalah korelasi serial urutan keempat (empat lag). Misalkan Anda menjalankan regresi
0
yt = xt + ut

Tes ini melibatkan menjalankan regresi residual pada variabel yang termasuk dalam regresi
asli dan residual yang tertinggal

ubt = b 0x + 1ubt1 + 2ubt2 + 3ubt3 + 4ubt4 + "t

130
Machine Translated by Google

kemudian menguji hipotesis bersama 1 = 2 = 3 = 4:

Ada banyak tes diagnostik yang melibatkan regresi sisa yang diperkirakan atau kekuatan residual
pada variabel tertentu. Secara teknis, sebagian besar dari ini
tes yang dikenal sebagai Tes Pengganda Lagrange. Penting bagi Anda untuk memeriksa
persamaan untuk berbagai penyakit sebelum Anda menganggapnya cukup sehat untuk digunakan.
Paket statistik seperti EViews (bagian 22.2), MicroÖt, Stata, dll. telah dibuat
dalam pengujian asumsi yang diperlukan agar estimasi Kuadrat Terkecil menjadi
dapat diandalkan. Jika asumsi tidak memenuhi estimasi kesalahan standar yang mungkin terjadi
menjadi salah dan memperbaiki kesalahan standar yang 'kuat' terhadap kegagalan
asumsi tersedia.

21. Data Ekonomi dan Keuangan III: Variabel dan Relasi


tionships

Regresi linier sangat fleksibel karena kita dapat mendefinisikan ulang variabel dengan beberapa
transformasi, yang memungkinkan hubungan yang mendasarinya menjadi non-linier, tetapi
hubungan yang kami perkirakan linier, seperti pada 18.1. Kita juga dapat membuat variabel,
seperti tren di 18.1.

21.1. Variabel boneka.

Misalkan kita memiliki data tahunan Inggris tentang konsumsi dan pendapatan untuk tahun 1930 hingga 1960
dan ingin memperkirakan fungsi konsumsi. Periode ini termasuk yang kedua
perang dunia, 1939-1945, ketika ada penjatahan dan konsumsi dibatasi.
Ini akan menggeser fungsi konsumsi dan dapat dibenarkan dengan memperkirakan
sebuah persamaan
Ct = + Yt + Dt + ut

di mana Dt adalah variabel Dummyî yang mengambil nilai satu 1939-45 dan nol di
tahun lainnya. Intersep selama Perang adalah + dan kami harapkan
< 0: Kita juga bisa menulis ini

Ct = 1Dt + 2(1 Dt) + Yt + ut (21.1)


b b

1 perkiraan
kita akan mendapatkan perkiraan yang identik ;di kedua persamaan, adalah
b b b
b b

intersep 1939-45, 2 = adalah intersep untuk tahun-tahun lainnya dan = 1 2,

perbedaan intersep antara dua periode. Perhatikan bahwa Anda telah menyertakan

131
Machine Translated by Google

konstanta di (21:1) komputer akan menolak untuk memperkirakannya dan memberi tahu Anda bahwa
matriks data itu tunggal. Ini dikenal sebagai 'perangkap variabel dummy'.
Teknik serupa memungkinkan efek musiman. Misalkan kita memiliki data triwulanan tentang
konsumsi dan pendapatan, dan ingin memungkinkan konsumsi berbeda per triwulan (misalnya
belanja lebih banyak saat Natal). Definisikan Q1t sebagai variabel dummy yaitu satu dalam
seperempat satu dan nol sebaliknya; Q2t adalah satu dalam seperempat dua nol sebaliknya, dll.
Kemudian perkirakan

Ct = 1Q1t + 2Q2t + 3Q3t + 4Q4t + Yt + ut

maka intersep di Q1 adalah 1 di Q2 adalah 2; dll.

21.2. Non-linearitas

21.2.1. Kekuatan

Kita dapat dengan mudah mengizinkan non-linier dengan transformasi data seperti yang kita lihat
dengan logaritma di atas. Sebagai contoh lain, bayangkan y (misalnya pendapatan) pertama naik
dengan x (misalnya usia) lalu turun. Kita bisa memodelkan ini dengan

yi = a + bxi + cx2 saya


+ ui

di mana kita harapkan b > 0; c < 0: Meskipun hubungan antara y dan x tidak linier, modelnya linier
dalam parameter, sehingga kuadrat terkecil biasa dapat digunakan, kita hanya memasukkan variabel
lain yang merupakan kuadrat pertama. Perhatikan bahwa pengaruh x terhadap y diberikan oleh

@y = b + 2cxi
@x

dengan demikian berbeda pada nilai xi yang berbeda


; dan dapat
memiliki
dihitung
maksimum
sebagai
(atau
nilaiminimum)
x yang membuat
yang
turunan pertama nol. Penghasilan naik seiring bertambahnya usia hingga maksimum kemudian
turun, kebahagiaan yang dilaporkan sendiri cenderung turun dengan usia ke minimum kemudian
naik. Orang paruh baya kaya tapi sengsara. Kita dapat memperluas pendekatan ini dengan
memasukkan produk dari dua variabel sebagai regressor tambahan. Ada contohnya dalam ujian
spesimen, bagian 3.2 pertanyaan 5. Verbeek bagian 3.5 memiliki diskusi yang luas.

132
Machine Translated by Google

21.2.2. Latar Belakang: Regresi menggunakan Proporsi

Misalkan variabel terikat kita adalah proporsi, pt = Nt=K; dimana Nt adalah angka yang
terpengaruh dan K adalah populasi, atau angka maksimum atau tingkat kejenuhan.
Kemudian pt terletak di antara nol dan satu dan transformasi logistik (ln(pt=(1 pt)) sering
digunakan untuk memastikan hal ini: Jika proporsi adalah fungsi waktu yang diberikan,

ln = a + bt + ut (21.2)
poin 1 poin

yang merupakan kurva berbentuk S untuk pt dari waktu ke waktu. Hal ini sering memberikan
gambaran yang baik tentang penyebaran barang baru (misalnya proporsi penduduk yang
memiliki telepon seluler) dan dapat diperkirakan dengan kuadrat terkecil. Meskipun ini adalah
hubungan non linier dalam variabel pt , ini linier dalam parameter ketika ditransformasikan
sehingga dapat diestimasi dengan kuadrat terkecil. Bentuk hubungan tak linier tersebut adalah

Nt 1
pt = = (21.3)
K 1 + exp (a + bt)

Kami dapat memperkirakan ini secara langsung, memperlakukan K sebagai parameter yang tidak
diketahui dalam program seperti EViews yang melakukan kuadrat terkecil non-linear. Jadi jika Nt
adalah jumlah pemilik ponsel, kami akan memasukkan ini di Eviews sebagai

N = C(1)=(1 + exp(C(2) + C(3) @trend)): (21,4)

@trend di EViews memberikan tren, t. C(1) akan menjadi perkiraan K; C(2) dari a dan C(3) dari
b. Dalam praktiknya, kecuali pasar sangat dekat dengan saturasi, sulit untuk memperkirakan K
secara tepat: Perhatikan bahwa (21:2) dan (21:4) menyiratkan asumsi yang berbeda tentang
bagaimana istilah kesalahan masuk (21:3) jadi tidak setara:

22. Latihan Terapan III: Menjalankan regresi


Anda dapat menjalankan regresi di Excel tetapi dalam banyak kasus lebih mudah menggunakan
paket khusus. Ada banyak dari mereka dan jika Anda terbiasa dengan paket tertentu, Anda
dapat menggunakannya. EViews adalah paket yang sangat mudah digunakan dan diinstal pada
mesin kami. MicroÖt adalah paket ekonometrika lain yang mudah digunakan. Contoh ini
menggunakan le Shiller.xls yang digunakan dalam Latihan Terapan I dan ada di halaman
beranda ASE. Ini memiliki data 1871-2000 (130 pengamatan) pada 5 variabel NSP (harga
saham nominal), ND (dividen nominal) NE (pendapatan nominal, laba)

133
Machine Translated by Google

dan R (suku bunga) dan PPI (indeks harga produsen). Perhatikan bahwa tidak ada 2000
data pada tiga variabel. Angka diberikan pada NSP dan PPI yang merupakan angka
Januari, tiga lainnya adalah rata-rata untuk tahun tersebut. Bahkan jika Anda tidak
menggunakan EViews, bacalah penjelasannya dan lakukan latihan pada perangkat
lunak yang Anda gunakan. Contoh di bawah ini meregresi dividen atas pendapatan
untuk periode 1871-1986. Pertama kami menjelaskan beberapa output yang dihasilkan komputer.

22.1. Keluaran Regresi

Program komputer akan mencetak berbagai informasi, yang mungkin termasuk:


b

perkiraan koefisien regresi stant saya , saya = 1; :::; k termasuk kon

kesalahan standar setiap SE koefisien i ) yang mengukur seberapa tepat


(diperkirakan;
b b

rasio t t( i = 0) = i ) yang menguji


saya = SE(hipotesis nol bahwa koefisien tertentu benar-

benar nol (variabel seharusnya tidak muncul dalam regresi): Jika rasio t lebih
besar dari 2 dalam nilai absolut, kita dapat menolak = 0 pada sekitar tingkat 5%.
dikatakan berbeda nyata dari nolDalam
saya
hal ini hipotesis nol yang koefisiennya
atau signifikan.

nilai p untuk hipotesis yang = 0: Ini memberikan probabilitas bahwa hipotesis nol
saya

itu benar. Jika ini kurang dari 0,05 lagi kita dapat menolak hipotesis bahwa = 0:
saya

2
Jumlah Residu Kuadrat Pub t : Ini adalah kuadrat terkecil yang diminimalkan.

Kesalahan standar regresi

s = qXub 2 t =(Tk)

dimana k adalah jumlah koefisien regresi yang diestimasi dan T jumlah observasi.
Ini adalah perkiraan akar kuadrat dari varians kesalahan dan memberi Anda
2
gambaran tentang ukuran rata-rata kesalahan: Jika variabel dependen adalah
logaritma, kalikan s dengan 100 dan tafsirkan sebagai persentase kesalahan rata-
rata.

134
Machine Translated by Google

R kuadrat, yang memberi tahu Anda proporsi variasi dalam variabel dependen
yang dijelaskan oleh persamaan

R2 = 1 pub t2 = P(Ybt Y )
2

P (Yt Y ) 2 P(Yt Y ) 2

R bar kuadrat, yang mengoreksi R kuadrat untuk derajat kebebasan

R2 = 1 pub t2 =(Tk)
P(Yt Y ) 2=(T 1)

di mana k adalah jumlah koefisien regresi yang diestimasi dan T adalah jumlah
observasi. Sedangkan R2 selalu positif dan meningkat ketika Anda bisa menjadi
2
menambah variabel,negatif
R memiliki
dan hanya
rasio t meningkat
lebih besarjika
darivariabel
satu. yang ditambahkan

Statistik Durbin Watson adalah ukuran korelasi serial dari residu

2
DW = PT t=2(ubt ubt1)
ub 2
PT t=1 t

mengukur apakah residual berkorelasi. Seharusnya sekitar 2, katakanlah


1,5-2,5. Ini menguji hipotesis = 0 dalam autoregresi ut = ut1 + "t : Kira-kira DW
= 2(1 ): Statistik ini tergantung pada urutan data, karena menghitung ut ut1:
Dalam deret waktu ada urutan alami dari data, di penampang tidak ada. Jadi di
penampang DW harus ditafsirkan dengan hati-hati.

Statistik F yang menguji hipotesis bahwa tidak ada variabel kemiringan (yaitu
variabel sisi kanan selain konstanta b) yang signifikan.
Perhatikan bahwa dalam kasus variabel kemiringan tunggal, ini akan menjadi kuadrat
dari statistik t-nya. Biasanya juga memberikan probabilitas untuk mendapatkan nilai
F-statistik jika semua variabel kemiringan tidak berpengaruh.

22.2. Unggul

Masuk ke Excel, Muat file Shiller.xls. Klik Alat; Analisis data; Pilih Regresi dari daftar
teknik. Anda mungkin harus menambahkan modul analisis data. Di mana ia meminta
Anda rentang Y masukkan C2:C117. Di mana ia meminta Anda rentang X

135
Machine Translated by Google

masukkan D2:D117. Klik Output Range dan masukkan di kotak output range G1. Atau Anda
dapat membiarkannya secara default meletakkan hasilnya di lembar terpisah.
Klik Oke. Ini memberi Anda di kotak pertama, Beberapa R, yang dapat Anda abaikan, R
kuadrat dan Disesuaikan R Kuadrat dan Kesalahan Standar Regresi. Kemudian itu memberi
Anda kotak ANOVA yang dapat Anda abaikan. Kemudian ini memberi Anda perkiraan
koefisien (intersep, Variabel X 1, dll), kesalahan standarnya, statistik t, dan nilai P, dll. yang
ditunjukkan dalam output ringkasan.
Dalam hal ini kami telah menjalankan regresi dividen atas pendapatan dan hasil untuk
sampel 1871 1986 adalah: NDt = 0:169+ 0:456NET +ubt (0:036) (0:007) [4:67] [61 :65]
f0:000g f0:000g R2 = 0:971; s = 0:31: Kesalahan standar koefisien diberikan dalam
tanda kurung,Anda
statistik
biasanya
t dalam
hanya
tanda
akan
kurung,
melaporkan
dan nilaisatu
p dalam
dari tiga,
tanda
biasanya
kurung.
hanya kesalahan
maka dividen
standar.akan
Interpretasinya
naik $4,56. adalah
Jika pendapatan
jika pendapatan
nol, dividen
naik $10,
akan menjadi 16,9 sen. Laba menjelaskan 97% dari variasi dividen selama
periode ini dan rata-rata kesalahan dalam memprediksi dividen adalah 0,31. Kami
berharap prediksi kami berada dalam dua kesalahan standar dari nilai sebenarnya 95%
dari waktu. Baik intersep dan koefisien pendapatan berbeda secara signifikan dari nol pada
tingkat 5%: statistik t mereka lebih besar dari 2 dalam nilai absolut dan nilai p mereka kurang
dari 0,05.

Di Excel, jika Anda mengklik kotak residu, itu juga akan memberi Anda nilai prediksi dan
residu untuk setiap pengamatan. Jika Anda menggunakan Excel, Anda harus membuat
grafik residual ini untuk menilai seberapa baik asumsi kuadrat terkecil berlaku. Anda dapat
memiliki lebih banyak variabel sisi kanan, X, tetapi mereka harus bersebelahan dalam
spreadsheet, berdampingan. Jadi misalnya kita bisa memperkirakan

NDt = + NET + NSPt + ut

dengan memberikan rentang X sebagai D2:E117.

136
Machine Translated by Google

22.3. EViews

22.3.1. Memasukkan Data

Buka program EViews, versi yang berbeda mungkin sedikit berbeda. Klik File,
Baru, WorkÖle, terima data tahunan default dan masukkan lamanya waktu
seri 1871 2000 di dalam kotak. OKE. Anda sekarang akan mendapatkan kotak yang memberi tahu Anda bahwa Anda memilikinya

le dengan dua variabel C (yang mengambil nilai kesatuan untuk setiap pengamatan) dan
RESID yang merupakan variabel dimana estimasi dari residual akan disimpan.
Klik File, Impor, Baca Teks-Lotus-Excel, lalu klik file Shiller. Dia
akan membuka sebuah kotak. Katakan, di kotak yang relevan, bahwa ada 5 variabel. Perhatikan
opsi lain, tetapi gunakan default, perhatikan bahwa B2 adalah tempat yang tepat untuk mulai membaca
file data ini. Klik Baca. Anda sekarang juga harus memiliki PPI, ND, NE dan NSP R
dalam pekerjaan Anda. Klik dua kali pada NSP dan Anda akan melihat data dan memiliki berbagai
pilihan lain termasuk grafik.
Sorot NE dan ND. Klik Cepat, lalu Grafik, grafik garis OK, dan Anda
akan melihat grafik dari dua seri ini. Tutup grafik. Selalu buat grafik Anda
data.
Gunakan perintah Save As untuk menyimpan WorkÖle dengan nama baru dan tetap menyimpan
ketika Anda menambahkan data baru, transformasi, dll.

22.3.2. Memperkirakan Regresi

Klik Quick, Estimate Equation dan Anda akan mendapatkan sebuah kotak. Masukkan ND C NE; mengatur
sampel sebagai 1871 1986. OK dan Anda akan mendapatkan sebuah kotak dengan perkiraan persamaan. Melihat
bahwa Anda memiliki tombol menu baik pada kotak persamaan dan jendela utama. Itu
perkiraan sama seperti yang diberikan di atas untuk Excel.
Variabel Dependen: ND
Metode: Kuadrat Terkecil
Tanggal: 29/07/04 Waktu: 14:00
Contoh: 1871 1986
Pengamatan yang disertakan: 116
Koefisien Variabel C NE Std. t-Statistik Masalah.

0.456537 R-squared
0.168391
0.971464 Kesalahan 0,035869 4,694672 0,0000
Adjusted R-squared
SE 0.971214
regresi 0,007328 62,2974 1 0,0000
0.316949 Rata-rata tergantung var 1.445948
Tergantung SD var 1.868085
Kriteria info Akaike 0.556937

137
Machine Translated by Google

Jumlah kuadrat penduduk Kriteria Schwarz 0.604413


11,45203 Kemungkinan log F-statistik 3880.968
-30,30234 Statistik Durbin-Watson 0,659872 Prob (F-statistik) 0,000000

Misalkan persamaannya adalah

Yt = + Xt + ut ; t = 1; 2; :::; T:

Program memberi Anda variabel dependen Yt dalam hal ini ND;


; metode estimasi, dalam hal ini
kuadrat terkecil; tanggal dan waktu; sampel yang Anda gunakan, dalam hal ini 1871 1986; dan
jumlah pengamatan, 116. Kemudian untuk masing-masing kanan dan b; variabel sisi standarnya,
b

perkiraan koefisien, kesalahan, statistik t dan nilai p (Prob). ini memberi Anda

Membaca kolom pertama memberikan: R-kuadrat; Disesuaikan R-kuadrat, biasanya disebut


R bar kuadrat; Kesalahan Standar Regresi, yang mengukur ukuran rata-rata kesalahan dalam
ub2 t ;
memprediksi Yt ; Jumlah Residual Kuadrat PT Abaikan Log-kemungkinan; Statistik Durbin Watson
t=1
Dalam regresi ini, DW sebesar 0,662 menunjukkan bahwa ada sesuatu yang sangat salah. Kolom
kedua memberikan mean dan standar deviasi dari variabel dependen, dua kriteria yang dapat Anda
abaikan untuk saat ini dan F-statistik dan nilai p untuk hipotesis bahwa semua koefisien kemiringan
adalah nol.

Di Eviews ketika Anda memiliki kotak persamaan di layar, klik Lihat di bilah alat kotak dan
Anda akan melihat berbagai opsi. Residual yang Dipasang Aktual memungkinkan Anda untuk
membuat grafik aktual dan tted (nilai prediksi) untuk variabel dependen dan residu. Selalu lihat
grafik nilai prediksi dan residual.
Di bawah Residual Anda dapat menguji normalitas, korelasi serial, heteroskedastisitas dan di
bawah stabilitas Anda dapat menguji RESET non-linier atau perubahan struktural dalam parameter
di beberapa titik. Gunakan Chow Break point jika Anda tahu kapan hubungan bergeser, atau grafik
Cusum jika tidak. Jika grafik keluar dari pita kepercayaan ada masalah. Dalam setiap kasus,
hipotesis nolnya adalah bahwa model terspesifikasi dengan baik (tidak memiliki masalah) sehingga
nilai p yang kecil (p<0,05) membuat Anda menolak hipotesis bahwa ini adalah persamaan yang
sehat. Verbeek bagian 3.3 dan 4.4 dan 4.7 membahas banyak dari tes ini.

22.3.3. Sebuah spesifikasi yang berbeda.

Tutup kotak persamaan. Klik Cepat, Hasilkan, masukkan di dalam kotak persamaan

LRD = log(ND=PPI)

138
Machine Translated by Google

dan klik OK. Anda akan melihat bahwa variabel baru, log dividen nyata, telah ditambahkan ke workÖle.

Lakukan hal yang sama untuk menghasilkan log pendapatan riil: LRE=log(NE/PPI). Grafik LRD
dan LRE. Klik Cepat, Perkirakan persamaan, dan masukkan LRD C LRE LRD(-1) di dalam kotak. Ini
memperkirakan persamaan bentuk

Yt = + Xt + Yt1 + ut

dimana variabel terikat dipengaruhi oleh nilainya pada periode sebelumnya.


Perkiraannya adalah:

LRDt = 0:517+ 0:248LREt+ 0:657LRDt1 R2 = 0:94 (0:107) (0:034) (0:046) s =


0:108 Meskipunbahwa
ini memiliki
lebih buruk
R2 sebesar
dari
yangpersamaan
memiliki
0,94, tidak
R2
0,97,
sebelumnya
berarti
sebesar
karena

kedua persamaan memiliki variabel terikat yang berbeda. Di atas variabel terikat adalah dividen
nominal, ini dia log dividen riil. Statistik Durbin Watson untuk persamaan ini adalah 1,72 yang jauh lebih
baik. Ini adalah persamaan dinamis karena termasuk variabel dependen tertinggal. Elastisitas jangka
panjang dari dividen terhadap pendapatan adalah 0:248=(1 0:657) = 0:72: Peningkatan 1% dalam
pendapatan dikaitkan dengan peningkatan 0,72% dalam dividen dalam jangka panjang.

23. Dinamika
Dengan data penampang, masalah utama cenderung mendapatkan bentuk fungsional yang benar;
dengan data time-series masalah utama cenderung mendapatkan ketergantungan dari waktu ke waktu,
dinamika, benar.

23.1. Regresi otomatis dan kelambatan terdistribusi

Kami telah menemukan autoregressions (AR), regresi variabel pada nilai tertinggal itu sendiri ketika
membahas korelasi serial dalam istilah kesalahan. Mereka juga dapat digunakan untuk variabel seperti
di atas kita menjalankan regresi dividen pada pendapatan konstan, dan nilai dividen yang tertinggal.
Sebuah autoregression orde pertama akan mengambil bentuk

yt = 0 + 1yt1 + ut
parameter dapat diperkirakan dengan kuadrat terkecil. Jalan acak dengan drift, contoh pertama model
kami di bagian 5.2, adalah kasus khusus di mana = 1: Jika 1

139
Machine Translated by Google

1 < 1 < 1 proses stabil, itu akan menyatu kembali ke ekuilibrium jangka panjang setelah
guncangan. Kesetimbangan jangka panjang dapat diperoleh dari asumsi yt = yt1 = y (seperti
yang terjadi pada keseimbangan tanpa guncangan) sehingga

y= 0+1
tahun y = 0=(1 1):

Menggunakan bintang untuk menunjukkan nilai keseimbangan jangka panjang. Jalan acak tidak
memiliki keseimbangan jangka panjang, ia dapat berkeliaran di mana saja.
Autoregresi orde kedua (dua lag) mengambil bentuk

yt = 0 + 1yt1 + 2yt2 + ut :

Ini stabil jika 1 < 1 + 2 < 1; dalam hal ini nilai harapan jangka panjangnya adalah

0
y=
1 1 2

Kita mungkin juga mendapatkan respon yang lambat dari pengaruh variabel independen, ini
disebut lag terdistribusi (DL). Jeda terdistribusi urutan pertama mengambil bentuk

yt = + 0xt + 1xt1 + ut

dan kita bisa memiliki versi pesanan yang lebih tinggi.


Kita dapat menempatkan urutan pertama AR1 dan DL1 bersama-sama untuk mendapatkan ARDL(1,1)

yt = 0 + 1yt1 + 0xt + 1xt1 + ut

Sekali lagi dapat diperkirakan dengan kuadrat terkecil. Seringkali ada alasan teoretis yang kuat
untuk bentuk-bentuk seperti itu.
Dalam banyak kasus penyesuaian menuju ekuilibrium lambat. Hal ini dapat diatasi dengan
mengasumsikan hubungan ekuilibrium jangka panjang, misalnya antara konsumsi dan pendapatan

C = 0 + 1 Tahun (23.1)
t

dan model penyesuaian parsial (PAM)

Ct = (C t Ct1) + ut : (23.2)

Ct = Ct Ct1; adalah perubahan konsumsi. Orang-orang menyesuaikan konsumsi mereka untuk menghilangkan sebagian
dari perbedaan antara konsumsi ekuilibrium dan konsumsi pada periode sebelumnya. Koefisien adalah koefisien penyesuaian,
itu

140
Machine Translated by Google

mengukur proporsi penyimpangan dari keseimbangan yang dibuat dalam suatu periode
dan kami mengharapkan 0 < 1; dengan = 1 menunjukkan penyesuaian seketika
dan = 0 tidak ada penyesuaian. Kita bisa menulis ini

Ct = 0 + 1Yt Ct1 + ut

atau

Ct = 0 + 1Yt + (1 ) Ct1 + ut
kita hanya akan menjalankan regresi konsumsi pada konstanta, pendapatan dan tertinggal
konsumsi,
Ct = 0 + Yt + 1Ct1 + ut
Kita dapat memulihkan parameter teoritis; 0, 1 dari parameter yang diperkirakan
diberikan oleh komputer 0; : Jadi kami
b
1; memperkirakan kecepatan penyesuaian sebagai
b b b

= persamaan
= (1 b1); dan efek jangka panjang karena Ini adalah 1= : dinamis
1
itu termasuk nilai-nilai tertinggal dari variabel dependen. Apakah kita memperkirakannya menggunakan
perbedaan pertama Ct atau level Ct sebagai variabel dependen tidak masalah, kami
akan mendapatkan perkiraan yang identik dari intersep dan koefisien pendapatan. Itu
koefisien konsumsi tertinggal dalam persamaan level akan sama persis dengan
koefisien dalam persamaan diferensial pertama ditambah satu. Jumlah residu kuadrat akan
identik, meskipun R2 tidak, karena variabel dependennya berbeda.
Ini adalah salah satu alasan R2 bukan ukuran yang baik untuk t.
Untuk proses penyesuaian yang lebih kompleks, kita dapat mempertahankan hubungan jangka
panjang yang diberikan oleh (23:1) dan mengganti model penyesuaian parsial (23:2) dengan kesalahan
model koreksi (ECM), yang mengasumsikan bahwa orang merespons baik perubahan tersebut
dalam target dan kesalahan yang tertinggal

Ct = 1 C t + 2(C Ct1) + ut
t1
Ct = 1 1 Yt + 2( 0 + 1Yt1 Ct1) + ut
Ct = a0 + b0 Yt + b1Yt1 + a1Ct1 + ut :

dan kami dapat memperkirakan versi terakhir yang memberi kami perkiraan parameter,
yang merupakan fungsi dari parameter teoritis, (a0 = 2 0; b0 = a1 = 2); 1 1; b1 = 2 1;

sehingga kita dapat memecahkan parameter teoretis dari perkiraan kita, mis
b

efek jangka panjangnya adalah, = bb1=ab1:


1
Kita juga dapat mengatur ulang ECM untuk memberikan persamaan pendugaan
(diparameterisasi ulang) dari bentuk ARDL(1,1)

yt = 0 + 1yt1 + 0xt + 1xt1 + ut :

141
Machine Translated by Google

Dimana = 11 +a1; 1 = b0 +b1: Kita dapat menemukan solusi kesetimbangan jika modelnya
stabil, 1 < a1 < 1 dengan pengaturan yt = yt1 = y; xt = xt1 = x sehingga dalam jangka panjang
keseimbangan

y= 0 + 1 tahun + 0x + 1x
0 0+ 1
y= + x
1 1 1 1

y= 0 + 1x

Perkiraan jangka panjang ini, 0 dan 1 dapat dihitung dari perkiraan jangka pendek
yang0;dilaporkan
1; 0 ; oleh
1 komputer. Teori ekonomi biasanya membuat prediksi tentang hubungan jangka
panjang daripada hubungan jangka pendek. Melihat
perkiraan 1 akan sama apakah kita mendapatkannya dari ECM atau ARDL

persamaan kami atau dari memperkirakan versi non-linear.

23.2. Contoh latar belakang: ARCH

Harga aset cenderung menunjukkan pengelompokan volatilitas, diikuti periode volatilitas tinggi
oleh periode volatilitas rendah. Hal ini sering ditangkap dengan mengasumsikan bahwa varians
harga aset berkorelasi positif secara serial, sehingga varians yang tinggi dalam satu periode
membuat lebih mungkin bahwa akan ada varians yang tinggi pada periode berikutnya. Memperkirakan
logaritma dari harga aset adalah jalan acak

pt = pt1 + "t

pt = "t

2 2
Biasanya kita asumsikan bahwa E("t) = 0 dan E(" t )= ; memiliki varians yang konstan,
bersifat homoskedastis. Di sini kita akan mengasumsikan bahwa varians berubah seiring waktu
2 2
jadi E(" t ) = t; itu heteroskedastis, dan varians mengikuti urutan pertama
autoregresi:
2 2
t =+ t1 + vt :

Ini adalah Heteroskedastisitas Bersyarat Auto-Regresif, ARCH. Jika kita dapat memperkirakan
persamaan ini, kita dapat menggunakannya untuk memprediksi varians di masa depan. Ini adalah
2 2 2 2
dan sejak " t = ( hal)
= " t bisa
langsung, perkiraan terbaik kami tentang kami thanya
menjalankan regresi
2 2
( poin) = + ( pt1) + vt :

Varians pengembalian tak bersyarat adalah =(1 1 < < 1: ) dengan asumsi proses stabil

142
Machine Translated by Google

Di atas kita dapat memperkirakan varians secara langsung, biasanya kita mengasumsikan
bahwa kesalahan dari persamaan regresi yang diperkirakan menunjukkan ARCH. Misalkan kita
memperkirakan
0
yt = xt + "t
2 2
dimana E("t) = 0 dan E(" t ) = t : GARCH(1,1) orde pertama Generalized ARCH
modelnya adalah
2t 2 = a0 + a1" ti + b2 2 ti

lebih banyak lag dapat ditambahkan. Eviews dapat memperkirakan model GARCH dari berbagai bentuk.

23.3. Pikiran terakhir

Program statistik dan ekonometrik modern sangat kuat, Anda dapat dengan mudah
memperkirakan hampir semua hal yang Anda inginkan. Tugas yang sulit adalah
menafsirkan apa yang dikatakan keluaran program kepada Anda. Anda memiliki peluang
yang lebih baik untuk menginterpretasikan keluaran jika Anda memiliki: (a) membuat grafik
data dan mengetahui apa yang sebenarnya diukur; (b) menyelidiki konteks historis atau
kelembagaan data; (c) pemikiran tentang ekonomi atau konteks teoretis lainnya; (d)
memahami teknik statistik yang digunakan dan (e) mengetahui tujuan dilakukannya analisis
statistik. Cobalah untuk membiarkan data berbicara sendiri daripada mengalahkan pengakuan dari mereka.

24. Hasil matriks tambahan


24.1. Kasus bivariat dalam aljabar matriks
Pertimbangkan model kami sebelumnya

Yt = 1 + 2Xt + ut

untuk t = 1; 2; :::; T, yaitu himpunan persamaan T. Kesalahan, adalah ut = Yt untuk meminimalkan 1 2Xt :
2
modelnya adalah saya
Pu Kuadrat terkecil yangt dipilih
: Dalam bentuk matriks

y = X+ u

Y1 1X1 _ u1
2 3 2 3 2 3
Y2 = 1X2 _ 1 u2
6

6
7

7
6

6
7

7
+ 6

6
7

:: :: :: ::

2
4 YT 5 4 1 XT 5 4 uT 5

143
Machine Translated by Google

dan kita akan menggunakan X0X dimana X0 adalah transpose 2 T dari X; jadi X0X adalah 2 2

TP xt
(X 0X) = 2
Pxt Px _ t

X0X adalah matriks simetris jadi (X0X) = (X0X): Kami juga akan menggunakan invers dari
X0X
1 =
1 PX2 t PXt
(X 0X) 2
T PX2 t ( PXt) PXt T
2
Agar ini ada, varians dari Xt = T PX2 tidak boleh sama dengan
t nol.( PXt)
Gunakan latihan kelas (1) minggu 2 untuk menunjukkan bahwa ini adalah varians dari Xt : Ini juga
merupakan determinan dari X0X: Agar invers ada, matriks harus non-tunggal, dengan determinan bukan-
nol.
Jumlah residual kuadrat adalah skalar (matriks a 1 1), ub 0ub hasil kali vektor a (1 T) ub 0 dan vektor
b

a (T 1) u: Jika A adalah matriks


hasil kali
anm,(AB)
dan0 B
adalah
adalah
B0A0
matriks
hasil
A0mk,
:kali
A0B0
hasil
matriks
tidak
kali akm
AB
selaras,
adalah
B0 dengan
Anda
matriks
tidak
matriks
nk.
dapat
Transpos
amn
mengalikan matriks amn dengan matriks akm. Di bawah ini kami menetapkan y 0X X0 y: Secara umum
matriks tidak
Periksa
sama
ini.dengan
Kami memperluas
transposnya,
jumlah
tetapiresidu
keduanya
kuadrat
adalah
seperti
skalar,
yangjadi
kami
sama
lakukan
dengan
di atas:
transposnya.

b b0
=

ub 0ub = (y Xb) 0 (y Xb)


b0 b b0
2
0

0 = kamu y + X 0X X tahun

T
b2 b2 b b

ub2 1T + +2
X t = XY 2 + ( t 2 XX 2 t 1 2 XXt)
t=1
b b

2( 1 XXt + 2 XXtYt)

b0 b b2
Skalar adalah bentuk
X0X kuadrat, yaitu dari bentuk x 0Ax dan i muncul di dalamnya: Bentuk kuadrat
memainkan peran besar dalam ekonometrika. Sebuah matriks, A; adalah definit positif jika untuk
sembarang a; a0Aa > 0: Matriks dengan struktur X0X selalu definit positif, karena dapat ditulis sebagai
jumlah kuadrat. DeÖne z = Xa; lalu z
0
z = a 0X0Xa adalah jumlah elemen kuadrat dari z.

24.2. Diferensiasi dengan vektor dan matriks

144
Machine Translated by Google

Pertimbangkan hubungan linier:


0
P=x
1xn nx1
0
Maka diferensial P terhadap x atau x didefinisikan sebagai:

dP dP
= a dan dx0 0=
dx

Dalam kasus n= 2, kita dapat menulis:

a1
P = [x1; x2]
a2

= x1a1 + x2a2

Kemudian
dP dP = a1 dan dx1
dx2 = a2

Jadi
dP
dP a1
= dx1
dP
= =
dx dx2
a2

dan

dP dP dP
= ; = [a1; a2] = a
0

dx0 dx1 dx2


Perhatikan bentuk kuadrat:
0
Q=x A x 1xn
(nxn)( nx1)

0
Maka turunan Q terhadap x atau x didefinisikan sebagai:

dQ dQ = 2x 0A
= 2Ax dan dx
dx0

Dalam kasus n= 2, kita dapat menulis:

a11 a12 x1
Q = [x1; x2]
a12 a22 x2

dimana untuk penyederhanaan A diasumsikan simetris. Memperluas ini memberikan:

a11x1 + a12x2 a12x1


Q = [x1; x2]
+ a22x2
2
2 = a11x 1 + 2a12x1x2 + a22x 2

145
Machine Translated by Google

Jadi:
dQ dQ
= 2a11x1 + 2a12x2 dan = 2a12x1 + 2a22x2
dx1 dx2
Kemudian

dQ dx1 2a11x1 + 2a12x2 a11 a12 x1


=2
dx dQ
2a12x1 + 2a22x2 a12 a22 x2
= " dQ dx2 # =
=2A x
(2x2)( 2x1)

dan

dQ = dQ dQ
; = [2a11x1 + 2a12x2; 2a12x1 + 2a22x2]
dx0 dx1 dx2
a11 a12
= 2 [x1; x2]
a12 a22
=2x 0
SEBUAH

1x2 2x2

24.3. Teorema Gauss-Markov

Kita dapat memperoleh banyak hasil tanpa mengasumsikan normalitas. Kami sudah sering mengklaim
bahwa mean atau koefisien regresi adalah penduga varians minimum dalam
kelas penduga tak bias linier. Kami sekarang membuktikannya untuk kasus umum.
Verbeek bagian 2.3 mencakup ini. Ini berlaku untuk mean ketika berisi satu
elemen dan X hanyalah kolom satu. e

Pertimbangkan estimator linier lain dari bentuk = Cy dan kita asumsikan bahwa X
dan C adalah matriks x (non-stochastic)
e

= Cy = C(X+ u) = CX+ Cu
E(e) = CX+ CE(u)
e e

jadi akan tidak bias selama CX = I: Tulis = Cy = ((X0X) 1X0 + W)y;


yaitu W = C (X0X) 1X: Maka CX = I menyiratkan ((X0X) 1X0 + W)X = I atau
(X0X) 1X0X + WX = I atau I + WX = I: Ini hanya bisa benar jika WX = 0: e

Ini juga menyiratkan bahwa X0W0 = 0: Asumsikan bahwa ini adalah kasus untuk e
adalah

memastikan bahwa tidak bias. Mari kita lihat matriks kovarians varians dari : Ini adalah
e e e

0
E( (e))(e (e))0 = E( )( )

146
Machine Translated by Google

sejak tidak bias oleh asumsi. Dari atas


e

= + Cu = + ((X 0X) 1X 0 + W)u


e

= (X 0X) 1X 0u + W u
e e

0 0

E( )( ) = E((X 0X) 1X 0u + W u)((X 0X) 1X 0u + W u)

Saat kita mengalikan tanda kurung, kita memiliki empat suku, yang pertama adalah

1 2 1
E((X 0X) 1X 0uu0X(X 0X) )= (X 0X)

matriks varians-kovarians dari penduga kuadrat terkecil. Yang kedua adalah

E(W u u0W0 ) = 2WW0

yang ketiga adalah


2
E((X 0X) 1X 0uu0W0 ) = (X 0X) 1X 0W0 = 0

karena X0W0 = 0: Demikian pula

1 1
E(W uu0X(X 0X) ) = 2W X(X 0X) =0

karena XW = 0: Jadi Varians dari penduga tak bias linier lainnya adalah
e

2 1
V (e) = E((e))(e (e))0 = [(X 0X) + WW0 ]
= V (b) + 2WW0

karena WW0 adalah matriks definit positif untuk W 6= 0, kami telah menunjukkan bahwa di
kelas penduga tak bias linier, penduga OLS memiliki varians terkecil.
Suatu matriks nn, A adalah definit positif jika skalar kuadrat berbentuk b 0Ab > 0 untuk
sembarang vektor T 1 b: Dalam hal ini kita memerlukan b 0WW0 b > 0: DeÖne z = W0 b an
0 2
n 1 vektor maka b 0WW0 b = zz= Pz t jumlah kuadrat yang harus positif.

147
Machine Translated by Google

25. Indeks

AR (autoregresif) 138-141
ARDL (lag terdistribusi autoregressive) 140-142
Asimtotik 104
Rata-rata (rata-rata aritmatika) 41, 100-102
Teorema Bayes/Statistik Bayes 17-18, 77-8, 100
CAPM (model penetapan harga aset modal) 113-4,
Teorema limit pusat, 85-6
Fungsi produksi Cobb Douglas, 121-2
Interval kepercayaan, 107-8
Konsisten 104
Koefisien korelasi 43, 117
Kovarians, 42-3
Fungsi permintaan 16, 121
Variabel dummy, 131-2
Statistik Durbin Watson
Dinamika 139-42
ECM (model koreksi kesalahan) 140-1
hipotesis pasar yang efisien 37
Nilai tukar 95-6
Distribusi F, pengujian, 92, 129
GARCH, 142
PDB/GNP, Produk Domestik Bruto/Nasional 51-2, 55
Rata-rata geometris 41, 66, 94
Grafik 40, 50
Tingkat pertumbuhan, 55-9, 92-3
Uji hipotesis, 108-11
Nomor indeks, 66-70
Tingkat inflasi, 55-9, 66-70
Suku bunga, 92-4 114
Kurtosis, 43, 65
Hukum bilangan besar, 98
Kuadrat terkecil, 101, 116, 118
Logaritma, 37-8, 66-7, 93, 121-2
Logistik, 133
Rata-rata, lihat rata-rata dan rata-rata geometris

148
Machine Translated by Google

Median 35
Modus 35
Momen, 43-44, Metode momen, 99, 101, 115-6, 125
Monte Carlo, 97-8
Neymar-Pearson, 99
Distribusi normal, 86-8
Penyesuaian Sebagian 140-1
Kurva Phillips, 14
Nilai yang diprediksi, 120
Probabilitas 74-8
Fungsi produksi, 121-2
Proporsi, 105, 112-3, 133
Variabel acak, 81-4, 86
Regresi, bagian 17 dan seterusnya
Residu, 120
R kuadrat dan R bar kuadrat 118.134
Musiman, 132
Signifikansi, 100, 107-10, 128
Kemiringan, 58, 65
Deviasi Standar, 41-2, 103
Standar Error, mean 102-4, koefisien regresi 107, 117.128, regresi 117-8

Data standar distribusi


43 t dan uji 91, 108
Tren waktu 18, 121-2
Pengangguran, 52-3
Varians, 41-2

149

Anda mungkin juga menyukai