Anda di halaman 1dari 12

Nama : Sandy Ade Saputra

NPM : 1711031074
Jurusan : S1 Akuntansi
Mata Kuliah : Ekonometrika
Tugas Individu 2

Latihan Belajar Menggunakan Analisis Regresi..

1. Tulis arti dari masing-masing istilah berikut tanpa merujuk buku (atau catatan Anda), dan
bandingkan definisi Anda dengan versinya dalam teks untuk masing-masing:
a. enam langkah dalam menerapkan analisis regresi
b. variabel dummy
c. data cross-sectional
d. kesalahan spesifikasi
e. derajat kebebasan

2. Berlawanan dengan namanya, variabel dummy tidak mudah dipahami tanpa sedikit latihan:
a. Tentukan variabel dummy yang akan memungkinkan anda untuk membedakan antara
mahasiswa sarjana dan mahasiswa pascasarjana di kelas ekonometrik anda.
b. Tentukan persamaan regresi untuk menjelaskan nilai (diukur pada skala 4,0) yang
diterima setiap siswa di kelas anda mendapatkan tes ekonometrik pertama (Y) sebagai
fungsi dari nilai siswa di kursus sebelumnya dalam statistik (G), jumlah jam siswa belajar
untuk tes (H), dan variabel dummy yang Anda buat di atas (D). Apakah ada variabel lain
yang ingin Anda tambahkan?Jelaskan.
c. Apa tanda hipotesis dari koefisien D? Apakah tandanya tergantung pada cara yang tepat
di mana Anda mendefinisikan D? (Petunjuk: Secara khusus, misalkan Anda telah
membalik definisi 1 dan 0 di jawaban Anda untuk bagian a.) Bagaimana?
d. Misalkan Anda mengumpulkan data dan menjalankan regresi dan menemukan koefisien
estimasi untuk D yang memiliki tanda yangdiharapkan dan nilai absolut 0,5. Apa artinya
ini di istilah dunia nyata? Ngomong-ngomong, apa yang akan terjadi jika Anda hanya
memiliki mahasiswa sarjana atau hanya mahasiswa pascasarjana di kelasmu?
3. Apakah sekolah seni liberal membayar ekonom lebih banyak daripada yang mereka bayar ke
profesor? Untuk mengetahuinya, kami melihat sampel 2.929 anggota fakultas perguruan tinggi
kecil dan membangun model gaji mereka yang termasuk sejumlah variabel, empat di antaranya
adalah:.

dimana: Si = gaji profesor perguruan tinggi ith


Mi = variabel dummy sama dengan 1 jika profesor ke-i adalah laki-laki
dan 0 sebaliknya
Ai = variabel dummy sama dengan 1 jika profesor ke-i adalah Afrika-
Amerika dan 0 sebaliknya
Ri = tahun di tingkat dari profesor ith
Ti = variabel dummy sama dengan 1 jika profesor ke-i mengajar ekonomi
dan 0 sebaliknya

a. Hati-hati dalam menjelaskan arti estimasi koefisien M.


b. Persamaannya menunjukkan bahwa orang Amerika keturunan Afrika memperoleh $ 426
lebih banyak daripada anggota kelompok etnis lain, dengan konstan variabel lainnya
dalam persamaan. Apakah koefisien ini memiliki tanda yang Anda harapkan? Mengapa
atau mengapa tidak?
c. Apakah R variabel dummy? Jika tidak, apa itu? Hati-hati menjelaskan arti koefisien R.
(Petunjuk: Gaji profesor biasanya meningkat setiap tahun berdasarkan peringkat).
d. Apa kesimpulan Anda? Apakah ekonom berpenghasilan lebih dari profesor lain di
perguruan tinggi seni liberal? jelaskan.
e. Fakta bahwa persamaan berakhir dengan notasi “+. . . ”Menunjukkan bahwa ada lebih
dari empat variabel independen dalam persamaan. Jika Anda bisa menambahkan variabel
ke persamaan, apakah itu? jelaskan.
4. Kembali ke contoh regresi Woody dari Bagian 2.
a.Dalam setiap proyek regresi yang diterapkan, ada kemungkinan berbeda bahwa variabel
penjelas penting telah dihilangkan. Baca kembali diskusi tentang pemilihan variabel
independen dan berikan saran untuk variabel independen yang belum dimasukkan dalam
model (selain dari variabel yang telah disebutkan). Menurut Anda mengapa variabel ini
tidak termasuk?
b. Apa jenis kritik lain yang akan Anda miliki tentang sampel atau variabel independen
yang dipilih dalam model ini?
5. Misalkan Anda diberi tahu bahwa walaupun data tentang lalu lintas untuk Persamaan 5 masih
terlalu mahal untuk diperoleh, variabel tentang lalu lintas, yang disebut Ti, tersedia yang
didefinisikan sebagai 1 jika lalu lintas “berat” di depan restoran dan 0 sebaliknya. Lebih lanjut
anggap bahwa ketika variabel baru (Ti) ditambahkan ke persamaan, hasilnya adalah:

a. Apa tanda yang diharapkan dari koefisien variabel baru?


b. Apakah Anda lebih suka persamaan ini daripada yang asli? Mengapa?
c. Apakah fakta bahwa R2 lebih tinggi dalam Persamaan 7 berarti itu tentu lebih baik dari
Persamaan 5?

6. Misalkan variabel populasi pada Bagian 2 telah didefinisikan dalam unit yang berbeda, seperti
pada:

P = Populasi: ribuan orang yang tinggal dalam radius tiga mil dari lokasi Woody

a. Dengan definisi P ini, apa yang diperkirakan koefisien kemiringan dalam Persamaan 5?
b. Dengan definisi P ini, apa yang diperkirakan koefisien kemiringan dalam Persamaan 7 di
atas?
c. Apakah estimasi konstanta dipengaruhi oleh perubahan ini?
7. Gunakan EViews, Stata, atau perangkat lunak regresi komputer Anda sendiri untuk
memperkirakan Persamaan 5 menggunakan data pada Tabel 1. Bisakah Anda mendapatkan hasil
yang sama?

8. Tes subjek Graduate Record Examination (GRE) dalam bidang ekonomi adalah ukuran
pilihan ganda pengetahuan dan kemampuan analitis dalam ekonomi yang digunakan terutama
sebagai kriteria masuk bagi siswa yang mendaftar ke program Ph.D. dalam "ilmu sulit." Selama
bertahun-tahun, kritikus mengklaim bahwa GRE, seperti Scholastic Aptitude Test (SAT), bias
terhadap perempuan dan beberapa kelompok etnis. Untuk menguji kemungkinan bahwa tes
subjek GRE dalam bidang ekonomi bias terhadap wanita, Mary Hirschfeld, Robert Moore, dan
Eleanor Brown memperkirakan persamaan berikut (kesalahan standar dalam tanda kurung):

di mana:
GREi = skor siswa ke-i dalam ujian mata pelajaran Ujian Pascasarjana di bidang
ekonomi
Gi = variabel dummy sama dengan 1 jika siswa ke-i adalah laki-laki, 0 sebaliknya
IPK = IPK dalam kelas ekonomi siswa Ith (4 = A, 3 = B, dll.)
SATMi = skor siswa ke-i pada bagian matematika dari Tes Kemampuan
Gramedia
SATVi = skor siswa ke-i pada bagian verbal Tes Kemampuan Gramedia

a. Hati-hati menjelaskan arti koefisien G dalam persamaan ini. (Petunjuk: Pastikan untuk
menentukan singkat dari apa 39,7.)
b. Apakah hasil ini membuktikan bahwa GRE bias terhadap wanita? Mengapa atau
mengapa tidak?
c. Jika Anda akan menambahkan satu variabel ke Persamaan 8, apakah itu? Jelaskan
alasanmu.
d. Misalkan penulis telah mendefinisikan variabel gender mereka sebagai Gi= variabel
dummy sama dengan 1 jika siswa ke-i adalah perempuan, 0 jika tidak. Apa yang
diperkirakan dengan Persamaan 8 dalam kasus itu? (Petunjuk: Hanya intersep dan
koefisien perubahan variabel dummy.)

9. Michael Lovell memperkirakan model jarak tempuh bensin berikut dari berbagai model mobil
(standar kesalahan dalam tanda kurung):

di mana:

Gi = mil per galon model ke-i seperti yang dilaporkan oleh Serikat Pelanggan
berdasarkan tes jalan aktual
Wi = berat kotor (dalam pound) dari model ke-i
Ai = variabel dummy sama dengan 1 jika model engan memiliki transmisi
otomatis dan 0 sebaliknya
Di = variabel dummy sama dengan 1 jika model engan memiliki mesin diesel dan
0 sebaliknya
Ei = perkiraan Badan Perlindungan Lingkungan AS tentang mil per galon model
ke-i

a. sebuah hipotesis tanda-tanda untuk koefisien kemiringan W dan E. Yang manakah, jika
ada, apakah dari tanda-tanda koefisien yang diperkirakan berbeda dari yang Anda
harapkan?
b. Hati-hati mengartikan arti estimasi koefisien Ai dan Di. (Petunjuk: Ingatlah bahwa E ada
dalam persamaan.)
c. Lovell memasukkan salah satu variabel dalam model untuk menguji spesifik hipotesis,
tetapi variabel itu tidak harus dalam model jarak tempuh gas peneliti lain. Menurut Anda,
variabel apa yang ditambahkan Lovell? Hipotesis apa yang menurut Anda ingin diuji oleh
Lovell?
10. Bos Anda akan memulai produksi calon box-office terbarunya, Invasion of the Economists,
Bagian II, ketika dia memanggil Anda dan meminta Anda untuk membangun model penerimaan
kotor semua film yang diproduksi di lima tahun terakhir. Regresi Anda adalah (kesalahan standar
dalam tanda kurung):

dimana:

Gi = tanda terima bruto akhir dari film ke-8 (dalam ribuan dolar)

Ti = jumlah layar (bioskop) di mana film ke-i ditampilkan pada minggu pertama

Fi = variabel dummy sama dengan 1 jika bintang film ith adalah perempuan dan 0
sebaliknya

Ji = variabel dummy sama dengan 1 jika film ke-i dirilis pada bulan Juni atau Juli
dan 0 sebaliknya

Si = variabel dummy sama dengan 1 jika bintang film ke-i adalah superstar
(seperti Tom Cruise atau Milton) dan 0 sebaliknya

Bi = variabel dummy sama dengan 1 jika setidaknya satu anggota pemeran


pendukung film ke-i adalah superstar dan 0 sebaliknya

a. Hipotesis tanda-tanda untuk masing-masing koefisien kemiringan dalam persamaan.


Yang manakah, jika ada, dari tanda-tanda koefisien yang diperkirakan berbeda dari
harapan Anda?
b. Milton, bintang dari Invasion of the Economists yang asli, meminta $ 4 juta dari atasan
Anda untuk muncul di sekuelnya. Jika perkiraan Anda dapat dipercaya, haruskah ia
berkata "ya" atau mempekerjakan Fred (bukan siapa-siapa) seharga $ 500.000?
c. Bos Anda ingin menjaga agar biaya tetap rendah, dan biayanya $ 1,2 juta untuk merilis
film di 200 layar tambahan. Dengan asumsi perkiraan Anda dapat dipercaya, haruskah ia
muncul untuk layar tambahan?
d. Film ini dijadwalkan untuk rilis pada bulan September, dan itu akan menelan biaya $ 1
juta untuk mempercepat produksi cukup untuk memungkinkan rilis Juli tanpa merusak
kualitas. Dengan anggapan bahwa perkiraan Anda dapat dipercaya, apakah ini sepadan
dengan terburu-buru?
e. Anda mengasumsikan bahwa perkiraan Anda dapat dipercaya. Apakah Anda punya bukti
bahwa ini bukan masalahnya? Jelaskan jawabanmu. (Petunjuk: Asumsikan bahwa
persamaan tidak mengandung kesalahan spesifikasi.)

11. Mari kita mencari pengalaman lebih banyak dengan enam tahap dalam menerapkan regresi.
Misalkan Anda tertarik membeli Apple iPod (baik yang baru atau bekas) di eBay (situs lelang)
tetapi Anda ingin menghindari overbidding. Salah satu cara untuk mendapatkan wawasan
tentang berapa banyak tawaran akan harus menjalankan regresi pada harga di mana iPod telah
dijual lelang sebelumnya.
Langkah pertama adalah meninjau literatur, dan untungnya Anda menemukan beberapa bahan
yang bagus — khususnya artikel 2008 oleh Leonardo Rezende10 yang menganalisis lelang
Internet eBay dan bahkan memperkirakan model harga iPod.
Langkah kedua adalah menentukan variabel independen dan bentuk fungsional untuk persamaan
Anda, tetapi Anda mengalami masalah. Masalahnya adalah Anda ingin memasukkan variabel
yang mengukur kondisi iPod dalam persamaan Anda, tetapi beberapa iPod baru, beberapa
digunakan dan tidak bercela, dan beberapa digunakan dan memiliki goresan atau cacat lainnya.
a. Tentukan variabel (atau variabel-variabel) dengan hati-hati yang akan memungkinkan
Anda untuk mengukur tiga kondisi iPod yang berbeda. Harap jawab pertanyaan ini
sebelum melanjutkan.
b. Langkah ketiga adalah membuat hipotesis tanda-tanda koefisien persamaan Anda.
Asumsikan Anda memilih spesifikasi berikut. Tanda-tanda apa yang Anda harapkan
untuk koefisien NEW, SCRATCH, dan BIDRS? Jelaskan.

dimana:
PRICEi = harga jual iPod ith di eBay
NEWi = variabel dummy sama dengan 1 jika iPod ith baru, 0 sebaliknya
SCRATCHi = variabel dummy sama dengan 1 jika iPod pertama memiliki cacat
kosmetik minor, 0 sebaliknya
BIDRSi = jumlah penawar di iPod ith

c. Langkah keempat adalah mengumpulkan data Anda. Untungnya, Rezende memiliki data
untuk 215 mini Apple iPod berwarna perak, 4 GB tersedia di situs web, sehingga Anda
mengunduh data dan ingin menjalankan regresi pertama Anda. Namun, sebelum Anda
melakukannya, salah satu teman Anda menunjukkan bahwa pelelangan iPod tersebar
selama periode tiga minggu dan khawatir bahwa ada kemungkinan bahwa pengamatan
tersebut tidak sebanding karena mereka berasal dari periode waktu yang berbeda. Apakah
ini masalah yang valid? Mengapa atau mengapa tidak?
d. Langkah kelima adalah memperkirakan spesifikasi Anda menggunakan data Rezende,
menghasilkan:
apakah koefisien yang diperkirakan sesuai dengan harapan Anda? Jnjelaskan.
e. Langkah keenam adalah mendokumentasikan hasil Anda. Lihat hasil regresi di bagian d.
Apa, jika ada, yang hilang yang harus dimasukkan dalam format dokumentasi normal
kami?
f. (opsional) Perkirakan sendiri persamaan (Datafile = IPOD3), dan tentukan nilai item
yang Anda laporkan tidak ada dalam jawaban Anda untuk bagian e.

Jawaban :

1. Dalam hal ini enam langkah dalam mengaplikasikan analisis regresi merupakan langkah yang kita
gunakan untuk membentuk suatu analisis regresi dari data yang kita dapatkan. Adapun 6 langkah itu
meliputi
i. Membaca literatur atau bahan bacaan dan mengembangkan suatu model
ii. Menspesifikasikan model tersebut dengan menentukan bentuk dari independent variabel
dan bentuk fungsionalnya
iii. Melakukan hipotesis terhadap tanda dari koefesien yang diharapkan
iv. Mengumpulkan data, mengkaji dan memperbaiki data tersebut (memperjelas)
v. Mengestimasi dan mengevaluasi persamaan
vi. Dan menjadikan persamaan menjadi suatu dokumen yang meberikan hasil dari analisis
yang ingin diinginkan

a) Dummy variabel merupakan suatu variabel yang dapat merubah data kualitatif menjadi suatu
variabel kuantitatif contohnya jenis kelamin, warna kulit dan lain-lain
b) Cross sectional data set merupakan sebuah seperangkat data yang terkait dalam satu tahun yang
objeknya sangatlah banyak contohnya ialah komponen penggunaan dana pemerintah provinsi
pada tahun 2001 yang mana data yang dapat kita peroleh terdiri dari 33 data (provinsi)
c) Merupakan error yang tidak dapat kita pungkiri dan untuk mecegah perubahan pada persamaan
tersebut.
d) tingkat kebebasan atau kelebihan jumlah pengamatan (N) atas jumlah koefisien termasuk
perkiraan intersepsi

2.
a. Misalkan mahasiswa dilambangkan dengan D, Nilai D = 1 berarti bahwa
mahasiswa pascasarjana dan D = 0 untuk mahasiswa sarjana.
b. Persamaan regresi : Y = ß1 + ß2G + ß3H+ ß4D
Dimana :
Y = mahasiswa di kelas ekonometrika

G = nilai siswa di kursus sebelumnya

H = jumlah jam untuk ujian

D = nilai D = 1 berarti bahwa mahasiswa pascasarjana dan D = 0 untuk


mahasiswa sarjana.

Menurut saya dalam persamaan regresi diatas masih terdapat variabel yang bisa
ditambahkan, misalnya, banyaknya jumlah latihan mahasiswa untuk ujian.
Sehingga terbentuk persamaan regresi yang baru.
Persamaan regresi yang baru : Y = ß1 + ß2G + ß3H+ ß4D + ß5L
Dimana : Y = mahasiswa di kelas ekonometrika
G = nilai siswa di kursus sebelumnya
H = jumlah jam untuk ujian
D = nilai D = 1 berarti bahwa mahasiswa pascasarjana dan D = 0 untuk
mahasiswa sarjana.
L = banyaknya latihan mahasiswa untuk ujian.
c. Jika D didefinisikan sebagai dalam jawaban a, maka tanda koefisiennya akan
diharapkan positif. Jika D didefinisikan sebagai 1 jika mahasiswa pascasarjana, 0
jika sarjana, maka tanda yang diharapkan adalah negatif.
d. Koefisien dengan nilai 0,5 menunjukkan bahwa memiki makna yang konstan
terhadap variabel independen lainnya dalam persamaan regresi tersebut,
mahasiswa pascasarjana diharapkan mendapat setengah poin nilai lebih tinggi dari
mahasiswa sarjana. Jika hanya ada mahasiswa pascasarjana atau hanya sarjana di
kelas, koefisien D tidak bisa diperkirakan.

3.
(a). Seorang profesor pria dalam sampel ini menghasilkan $ 817 lebih dari seorang
profesor wanita, memegang konstan variabel independen lainnya dalam persamaan.
(b) Sebagian besar siswa akan mengharapkan koefisien negatif, sehingga mereka akan
menyebutnya tanda yang tidak terduga. Sebagian besar profesor dan administrator akan
mengharapkan tanda positif karena meningkatnya persaingan di antara perguruan tinggi
untuk profesor Afrika-Amerika, sehingga mereka akan menyebut ini sebagai tanda yang
diharapkan. Poin kunci di sini adalah tidak mengubah harapan hanya berdasarkan hasil
ini.
(c) R bukan variabel dummy karena mengambil lebih dari dua nilai. Untuk setiap tahun
tambahan dalam peringkat, gaji profesor ke-i akan naik sebesar $ 406, dengan konstan
variabel-variabel independen lainnya dalam persamaan.
(d) Ya. Koefisiennya besar dan, seperti yang akan kita pelajari di Bab 5, secara statistik
lebih besar dari nol. (Selain itu, ini cukup kuat.)
(e) Tidak ada ukuran kualitas profesor dalam persamaan yang berlaku, sehingga saran
yang baik mungkin jumlah artikel yang diterbitkan oleh profesor ke-i atau evaluasi
pengajaran rata-rata (pada skala standar) dari profesor ke-i.

4.
(a) Ada banyak kemungkinan variabel penjelas yang dihilangkan; misalnya, jumlah ruang
parkir di dekat restoran.
(b) Sampel bisa lebih besar, untuk suatu hal.

5.
(a) Positif.
(b) Jelas, persamaan terbaik termasuk data lalu lintas aktual (yang, ternyata, tersedia).
Karena variabel dummy lalu lintas berkorelasi dengan variabel lalu lintas aktual dan
karena persamaan baru memiliki tanda yang diharapkan dan koefisien yang masuk akal,
tampaknya sedikit lebih baik daripada Persamaan 3.5.
(c) Tidak! Dasar-dasar teoretis dari model ini jauh lebih penting. Tentu saja, semakin tinggi
R2 tentu merupakan nilai tambah.
6.
(a) P yang baru = P/1000 yang lama, jadi ˆP berubah dari 0,3547 ke 354,7 dan semua
koefisien lainnya tetap tidak berubah.
(b) ˆP = 320, dan semua koefisiennya tetap tidak berubah.
(c) Tidak
7. Berikut hasil dari penghitungan menggunakan analisis regresi pada microsoft office excel :
Standard
Coefficients Error
Intercept 103731,972 13326,37964
N Variable -0,0085959 0,002066695
P Variable 0,3302827 0,071148445
I Variable 1,24141469 0,560264604

Dari ananlisis regresi diatas dapat disimpulkan bahwa persamaan regresi dari penghitungan
diatas tidak sama dengan persamaan 5,yaitu:
Y =103731 – 0,0086𝑁𝑖 + 0,33𝑃𝑖 + 1,24𝑃𝑖

8.
(a) Skor mata pelajaran GRE siswa laki-laki di bidang Ekonomi kemungkinan 39,7 poin
lebih tinggi daripada perempuan, dengan IPK dan SAT mereka konstan.
(b) Hasil ini adalah bukti, tetapi bukan bukti, bias. Jika kami yakin bahwa kami memiliki
spesifikasi terbaik (topik Bab 6) dan jika hasil ini ternyata signifikan secara statistik
(topik Bab 5), dan jika kami dapat mereproduksi hasil ini dalam sampel lain, kami akan
jauh lebih dekat dengan "bukti." Bahkan kemudian, masih ada kemungkinan bahwa
beberapa faktor selain bias adalah penyebab hasil ini.
(c) Variabel yang mungkin termasuk jumlah mata pelajaran ekonomi divisi atas yang
diambil, jumlah kelas matematika yang diambil, dan variabel dummy yang mengukur
apakah siswa telah mengambil ekonomi ekonometrika atau internasional (dua bidang
yang sering dibahas dalam tes). Sangat penting bahwa setiap variabel yang disarankan
bersifat cross-sectional oleh siswa.
(d) Persamaannya akan menjadi :

GREi = 212.1 – 39.7Gi + 78.9GPAi  0.203SATMi  0.110SATVi

9.
(a) Negatif, Positif, Tidak ada
(b) Memiliki semua variabel penjelas lainnya termasuk konstan, mobil dengan
transmisi otomatis mendapat 2,76 mil lebih sedikit per galon daripada model
dengan transmisi manual, dan mobil dengan mesin diesel mendapat 3,28 mil
lebih per galon daripada satu tanpa mesin diesel .
(c) Lovell menambahkan variabel EPA karena dia ingin menguji keakuratan
estimasi EPA. Jika perkiraan ini sangat akurat, maka variabel EPA akan
menjelaskan semua variasi dalam mil per galon.

10

(a) Semua positif kecuali untuk koefisien Fi, yang di industri film didominasi pria saat ini
mungkin memiliki tanda negatif yang diharapkan. Tanda dari ˆB sangat tidak terduga.
(b) Fred, karena $ 500.000 < ($ 4.000.000 - $ 3.027.000).
(c) Ya, sejak 200 x 15,4 = $ 3.080.000 > $ 1.200.000.
(d) Ya, sejak $ 1.770.000 > $ 1.000.000.

11.

(a) Cara terbaik untuk menangani tiga kondisi diskrit adalah dengan menentukan dua
variabel dummy. Sebagai contoh, satu variabel dummy dapat = 1 jika iPod baru (dan 0
sebaliknya) dan variabel dummy lainnya bisa = 1 jika iPod digunakan tetapi tidak cacat
(dan 0 sebaliknya). Kondisi yang dihilangkan, bahwa iPod digunakan dan tergores, akan
diwakili oleh kedua variabel dummy yang sama dengan nol.
(b) Positif; negatif; positif.
(c) Secara teori, semakin sempit penyebaran waktu pengamatan, semakin baik sampel, tetapi
3 minggu mungkin adalah periode waktu yang cukup singkat untuk memastikan bahwa
pengamatan berasal dari populasi yang sama. Namun, jika 3 minggu itu termasuk kejutan
besar bagi pasar iPod, maka teman itu akan benar, dan sampel tersebut harus dibagi
menjadi “sebelum kejutan” dan “setelah kejutan” subsampel.
(d) Ya, mereka cocok dengan jawaban untuk bagian b.
(e) R2 menghilang
(f) R2 adalah 0.431

Anda mungkin juga menyukai