CHAPTER 4
C1 The following model can be used to study whether campaign expenditures affect election
outcomes:
Where voteA is the percentage of the vote received by Candidate A, expend A and expend B are
campaign expenditures by Candidates A and B, and prtystrA is a measure of party strength for
Candidate A (the percentage of the most recent presidential vote that went to A’s party).
(i) What is the interpretation of β 1?
Jawab:
Interpretasi dari β1adalah persentase poin perubahan voteA ketika expendA meningkat sebesar 1%
ceteris paribus.
(ii) In terms of the parameters, state the null hypothesis that a 1% increase in A’s expenditures is
offset by a 1% increase in B’s expenditures.
Jawab:
Mencari H0:
H0 : β 1 + β 2 = 0 atau
H0 : β 2 = - β 1
Jika pengeluaran dana kampanye dari Kandidat A naik sebesar 1%, dan pengeluaran dana kampanye
dari Kandidat B naik sebesar 1%, maka suara atau vote terhadap Kandidat A tidak akan berubah
(tidak naik dan tidak turun) jika kekuatannya sama.
(iii) Estimate the given model using the data in VOTE1 and report the results in usual form. Do A’s
expenditures affect the outcome? What about B’s expenditures? Can you use these results to test
the hypothesis in part (ii).
Jawab:
Dependent Variable: VOTEA
Method: Least Squares
Date: 11/19/19 Time: 11:02
Sample: 1 173
Included observations: 173
Koefisien pada log(EXPENDA) dan log(EXPENDB) secara statistik signifikan dibuktikan dengan nilai p-
value yaitu 0,000 (0,000 < α = 5%). Interpretasinya yaitu jika pengeluaran Kandidat A naik sebesar 1%
ceteris paribus maka vote/pilihan kepada Kandidat A akan naik sebesar 0,06083 persentase poin.
Jika pengeluaran Kandidat B naik sebesar 1% ceteris paribus maka vote/pilihan kepada Kandidat A
akan turun sebesar 0,0661 persentase poin.
Ketika koefisien pada log(EXPENDA) dan log(EXPENDB) tandanya berlawanan sesuai ekspektasi,
maka hipotesis yang digunakan seperti pada poin (ii) yaitu H0 : B1 = -B2.
(iV) Estimate a model that directly gives the t statistic for testing the hypothesis in part (ii). What do
you conclude? (Use a two-sided alternative.).
Diminta untuk menentukan dan uji Ho : b5 = 0 dimana ”rank” (ranking dari sekolah hukum) tidak
berpengaruh terhadap gaji.
Maka langkah pengerjaannya adalah:
a. Buka eviews > klik eviews workfile
c. Setelah file terbuka, kemudian klik Quick dan Pilih Estimate Equation
d. Masukkan formulasi: “log(salary) c lsat gpa log(libvol) log(cost) rank” kemudian klik OK
Variabel GPA signifikan dengan nilai p-value pada C(2) sebesar 0,004. Secara gabungan nilai F-
statistic sebesar 9,95 dengan (2, 130 degree of fredoom) dan nilai p-value menunjukkan bahwa
signifikan (0,0001 < α = 5%). Hal tersebut menunjukkan bahwa variabel lsat dan gpa secara bersama-
sama signifkan berpengaruh terhadap gaji pada tingkat signifikansi 5%.
f. Kemudian buka view > coefficient Diagnostics > Wald Test – Coefficient Restrictions
Wald Test:
Equation: Untitled
C3 Refer to Computer Exercise C2 in Chapter 3. Now, use the log of the housing price as the
dependent variable:
log(price) = β 0 + β 1sqrft + β 2bdrms + u.
(i) You are interested in estimating and obtaining a confidence interval for the percentage change in
price when a 150-square-foot bedroom is added to a house. In decimal form, this is u1 5 150b1 1 b2.
Use the data in HPRICE1.RAW to estimate θ1.
(ii) Write b2 in terms of u1 and b1 and plug this into the log(price) equation.
(ii) Use part (ii) to obtain a standard error for θ1 and use this standard error to construct a 95%
confidence interval.
JAWAB
log(price) c sqrft bdrms
Dependent Variable: LOG(PRICE)
Method: Least Squares
Date: 11/27/19 Time: 10:24
Sample: 1 88
Included observations: 88
(iiI) Dari hasil regresi (ii) , tentukan standar error θ1 dan gunakan standar error tersebut untuk
membentuk confidence interval dengan tingkat kepercayaan 95 persen.
log(price) c (sqrft-150*bdrms) bdrms
Dependent Variable: LOG(PRICE)
Method: Least Squares
Date: 11/28/19 Time: 08:38
Sample: 1 88
Included observations: 88
n = 88
R2=0,588295
standar error (θ^ 1) = 0,026768
Dengan tingkat kepercayaan 95 persen, maka Confidence interval θ^ 1yang terbentuk adalah sebagai
berikut
Select View/Coefficient Diagnostics/Confidence Intervals
90% CI 95% CI
Variable Coefficient Low High Low High
Dapat disimpulkan dengan tingkat kepercayaan 95 persen, nilai parameter θ^ 1 berada diantara nilai
0,0326 dan 0,139. Oleh karena dari hasil estimasi nilai θ^ 1 sebesar 0,085801 dan nilai parameter
berada didalam interval, dapat diartikan bahwa dengan tingkat kepercayaan 95 persen variabel
jumlah kamar (bdrms) signifikan mempengaruhi harga rumah.
C4 In Example 4.9, the restricted version of the model can be estimated using all 1,388 observations
in
the sample. Compute the R-squared from the regression of bwght on cigs, parity, and faminc using
all
observations. Compare this to the R-squared reported for the restricted model in Example 4.9.
bwght c cigs parity faminc motheduc fatheduc
R-kuadrat dari bwght regresi pada cigs, parity, dan faminc, menggunakan semua 1.388 pengamatan,
adalah sekitar 0,0348. Ini berarti bahwa, jika kita secara keliru menggunakan ini menggantikan
0,0364, yang merupakan kuadrat-R yang menggunakan 1.191 pengamatan yang sama yang tersedia
dalam regresi tidak terbatas, kita akan memperoleh:
(0,0348−0,0387) 1.185
F= x ≈ 2,40
(1−0,0387) 2
yang menghasilkan nilai-p 0,091 dalam distribusi F dengan 2 dan 1, 1185 df. Ini signifikan pada level
10%, tetapi tidak benar. Statistik F yang benar dihitung sebagai 1,42 pada Contoh 4.9, dengan nilai p
≈ 0,242
Steps: 1
Steps: 2
Steps: 3
Variable Coefficient Std. Error t-Statistic Prob. Variable Coefficient Std. Error t-Statistic Prob.
ii.
Add the variables runsyr (runs per year), fldperc (fielding percentage), and sbasesyr (stolen bases per
year) to the model from part (i). Which of these factors are individually significant?
Steps: 1
Steps: 2
-
Steps: Output
ketika variabell runsyr (runs per year), fldperc (fielding percentage), and sbasesyr (stolen bases per
year) dimasukkan ke dalam model, hanya variabel runsyr yang signifikan memengaruhi gaji (P-
value<0,05). Ketika variable runsyr naik 1 pelari per tahun akan menyebabkan gaji naik 1,74%
(0,017392*100%)
iii. In the mode
Wald Test:
Equation: Untitled
Ho: b3+b6+b8=0
H1: b3+b6+b8≠0
Kesimpulan : Tidak Tolak H0, Ketika menguji variabel bavg, fldperc, dan sbasesyr secara bersama
sama diperloreh hasi bahwa secara bersama-masa variabel ini tidak memengaruhi gaji dilihat dari uji
F dan Chi-square (p-value>0,05)
Jawaban
1. Consider the
log ( wage )=β 0+ β1 educ + β 2 exper + β3 tenure+ u
State the null hypothesis that another year of general workforce experience has the same effect on
log(wage) as another year of tenure with the current employer.
Ho: b2=b3
H1: b2≠ b3
Steps: 1
Steps 2:
Steps: Output
Dependent Variable: LWAGE
Method: Least Squares
Date: 12/04/19 Time: 08:54
Sample: 1 935
Included observations: 935
Steps: 5
Steps: Output
Wald Test:
Equation: Untitled
Variabel exper-tenure tidak signifikan memengaruhi gaji pada level 5% namun signifikan pada level
10%.
C7 Refer to the example used in Section 4-4. You will use the data set TWOYEAR.
(i) The variable
example, 90 means you are ranked better than 90 percent of your graduating class.) Find the
smallest, largest, and average phsrank in the sample.
Jawab
Phsrank adalah persentil dari siswa anak Sekolah Menengah Atas
Untuk mencari nilai terkeccil, terbesar dan rata rata dari phsrrank dalam sampel,
langkahnya:
Jawab
Log(wage) =β0+θ1jc+β2 totcoll+β3 exper+β4 phsrank+u
Jc = number of years attending a two-year college
Totcoll = jc+univ
Exper = months in the workforce
Baik dengan α (tingkat signifikansi) 5% atau 10% variabel phsrank tidak signifikan secara statistik.
Dapat dilihat pada nilai probabiltitanya (0.2044<α) Jika kita menaikkan nilai phsrank sebesar 10,
maka nilai dari log(wage) meningkat sebesar [10*0.000303] = 0.00303. Ini menyiratkan peningkatan
variabel phsrank sebesar 10% akan menyebabkan peningkatan upah sebesar 0.3% (Namun, standar
deviasi sampel phsrank adalah sekitar 24)
(ii) Does adding phsrank to (4.26) substantively change the conclusions on the returns to two- and
four-year colleges? Explain.
Jawab
Menambahkan phsrank membuat statistik t pada jc bahkan lebih kecil dalam nilai absolut,
sekitar 1,33, tetapi besarnya koefisien mirip dengan (4,26). Oleh karena itu, titik dasar tetap
tidak berubah: kembalinya ke perguruan tinggi junior diperkirakan agak lebih kecil, tetapi
perbedaannya tidak signifikan dan standar tingkat signifikan
C8 The data set 401KSUBS contains information on net financial wealth (nettfa), age of the
survey respondent (age), annual family income (inc), family size (fsize), and participation in
certain pension plans for people in the United States. The wealth and income variables are
both recorded in thousands of dollars. For this question, use only the data for single-person
households (so fsize 5 1).
(i) How many s
Jawab
Dari 9,275 sampel rumah tangga, terdapat 2,017 rumah tangga yang memiliki jumlah anggota rumah
tangga 1 orang.
(ii) Use OLS to e
nettfa = β0 +β1inc + β2 age + u,
and report the results using the usual format. Be sure to use only the single-person households in
the sample. Interpret the slope coefficients. Are there any surprises in the slope estimates?
Dependent Variable: NETTFA
Method: Least Squares
Date: 11/29/19 Time: 11:25
Sample: 1 9275 IF FSIZE=1
Included observations: 2017
Koefisien inc sebesar 0.799317 berarti peningkatan $1000 inc (annual family income) menyebabkan
peningkatan nettfa (net financial wealth) sebesar $799.317, cateris paribus. Koefisien age sebesar
0.842656 berarti peningkatan 1 satuan variabel age (age of the survey respondent) meyebabkan
peningkatan nettfa (net financial wealth) sebesar $843, cateris paribus. Dari nilai slope untuk
variabel inc dan age tidak ada nilai yang mengejutkan karena sesuai dengan teori.
(iii) Does the int
Jawab:
Nilai intersep sebesar -43.04 berarti jika usia responden 0 tahun dan tidak memiliki pendapatan
maka nilai dari nettfa -43.04. Nilai intersep tersebut tidak bermakna karena tidak ada jangkauan nilai
variabel bebas memasukan 0 sebagai salah satu nilai yang diamati.
(iv) Find the p-value for the test H0: β2= 1 against H1: β2 < 1. Do you
Jawab:
H0: β2= 1
H1: β2 < 1
Wald Test:
Equation: Untitled
Jadi untuk menentukan keputusan apakah tolak H0 atau tidak tolak H0 memakai
rumus di bawah ini karena one tail:
t stat= ¿^¿-β2)/Se( ^
β 2 ¿= (0.843−1)/ 0.092= -1.71
t tabel= t(1-α;n-2) nilainya cenderung lebih dari t stat, jadi keputusannya adalah
tolak H0
(v) If you do a simple regression of nettfa on inc, is the estimated coefficient on
inc much different from the estimate in part (ii)? Why or why not?
Dependent Variable: NETTFA
Method: Least Squares
Date: 12/08/19 Time: 20:36
Sample: 1 9275 IF FSIZE=1
Included observations: 2017
KOefisien slope variabel inc pada simple regression adalah 0.821, tidak terlalu berbeda dg koefisien
slope pada model multiple regression yaitu 0.799. Dan setelah dilihat korelasi antara variabel inc dan
age adalah sebesar 0.039, ini menjelaskan bahwa kenapa pada simple dan multiple regression nilai
estimasi untuk koefisien slope variabel inc tidak berbeda.
C9. Use the data in DISCRIM to answer this question. These are ZIP code–level data on prices for
various items at fast-food restaurants, along with characteristics of the zip code population, in New
Jersey and Pennsylvania. The idea is to see whether fast-food restaurants charge higher prices in
areas with a larger concentration of blacks
(i) Find the average values of prpblck and income in the sample, along with their
standard deviations. What are the units of measurement of prpblck and income?
Jawab : buka data DISCRIM di Eviews 9 kemudian klik quick Group statistic Descriptive
stastistics common samplel
Setelah itu aka muncul tampilan seperti di bawah ini, kemudian masukkan variable yang akan
dihitung mean dan std deviasinya, klik ok.
PRPBLCK INCOME
Mean 0.113486 47053.78
Median 0.041444 46272.00
Maximum 0.981658 136529.0
Minimum 0.000000 15919.00
Std. Dev. 0.182416 13179.29
Skewness 2.700012 0.962831
Kurtosis 10.56841 7.551386
Dari hasil analisis statistic deskriptif di atas, diperoleh rata-rata nilai dari prpblck dan income dengan
standar deviasi sebagai berikut:
Rata-rata Pr
pos) adalah 0.1135 dengan standar deviasi 0.1824 yang dilakukan pada jumlah observasi/ jumlah
sampel sebanyak 409.
Rata-rata Inc
47053.78 dengan standar deviasi 13179.29 yang dilakukan pada jumlah observasi/jumah sampel
sebanyak 409.
(ii) Consider a m
that is black and median income:
psoda= β0 + β 1 prpblck + β 2 income +u
Estimate this model by OLS and report the results in equation form, including the sample size and R-
squared. (Do not use scientific notation when reporting the estimates.) Interpret the coefficient on
prpblck. Do you think it is economically large?
Setelah data DISCRIM dibuka, maka akan keluar tampilan di bawah, klik quick Estimate equation
Setelah itu, akan muncul tampilan seperti di bawah, masukkan variabel yang akan di regres sesuai
soal yang diminta, yakni
psoda= β0 + β 1 prpblck + β 2 income +u
Klik ok, maka akan keluar hasil regresi seperti di bawah ini
Dengan menggunakan income sebagai variable penjelas yang diregresikan secara simultan dengan
prpblck nilai β 1 = 0,1149 sedangkan bila tanpa menggunakan income sebagai variabel penjelas nilai
β 1 = 0,0649. Terjadi penurunan koefisien berdampak pada penurunan harga soda pada suatu
wilayah. Menurut saya, diskriminasi efek menjadi lebih kecil dengan tidak melibatkan variabel
income di dalam regresi karena hanya memperhatikan proporsi jumlah orang kulit hitamnya dalam
suatu wilayah saja.
(iv) A model wit
estimates of the model
log ( psoda)=β 0+ β1 prpblck + β 2 log (income)+u
If prpblck increases by 0.20 (20 percentage points), what is the estimated percentage change in
psoda? (Hint: The answer is 2.xx, where you fill in the “xx.”)
Hasil Regresi
Dependent Variable: LOG(PSODA)
Method: Least Squares
Date: 11/17/19 Time: 11:16
Sample: 1 410
Included observations: 401
Kenaikan 0.20 (20%) pada prpblck menyebabkan psoda naik sebesar = 0.20 x (0.121580) =0.024316
atau 2.4316%
Setelah ditambahkan variabel pprpov (proporsi penduduk miskin) ke dalam model maka, diperoleh
nilai koefisien prpblck lebih kecil ( koefisien prpblck turun menjadi 0.072807) dibanding sebelum
ditambah variabel pprpov (koefisien prpblck 0.1216). Jadi semakin bertambahnya proporsi orang
miskin maka akan menaikkan harga soda.
(vi) Find the cor
Nilai korelasi antara variabel log(income) dengan prppov sebesar -0.838467 yaitu kuat dan
berlawanan arah., sesuai dengan teori bahwa tingkat kemiskinan ditentukan oleh tingkat
pendapatan, yaitu semakin tinggi tingkat kemiskinan maka semakin rendah tingkat pendapatan.
(vii) Evaluate the
they have no business being in the same regression.”
Nilai korelasi yang tinggi (-0.838) antara variabel log(income) dengan prppov patut dicurigai adanya
multikoliniearitas. Untuk meyakinkan apakah terjadi multikolinearitas pada dua variabel tersebut,
maka dilakukan penghitungan nilai centered VIF, jika nilai centered VIF diatas 10 maka terjadi
multikolinearitas. Ternyata nilai Centered VIF sebesar 3.400755, sehingga anatar keuda variabel
tersebut tidak terjadi multikolinearitas.
Jadi tidak ada argument yang kuat yang mengatakan bahwa kedua variabel tersebut berkorelasi
kuat, tetapi kedua variabel tersebut digunakan hanya sebagai control untuk menentukan apakah ada
diskriminasi harga soda terhadap orang kulit hitam yang dikarenakan oleh variabel bebas
pendapatan dan proporsi orang miskin.
C10.
Use the data in ELEM94_95 to answer this question. The findings can be compared with those in
Table 4.1. The dependent variable lavgsal is the log of average teacher salary and bs is the ratio of
average benefits to average salary (by school).
(i) Run the simple regression of lavgsal on bs. Is the estimated slope statistically different fromzero?
Is it statistically different from -1?
H0: b2=0
H1: b2≠0
Nilai p-value pada b2 kecil dari α maka keputusan tolak H0, Variabel BS signifikan mempengaruhi
lavgsal. Selang kepercayaan yang di hasilkan adalah
Ketika
H0: b2=-1
H1: b2≠-1
Wald Test:
Equation: Untitled
ketika b2=-1 maka keputusan tidak tolak H0 dilihat dari niai F test mauun chi sqy=uare dimana p-
value>α
(ii) Add the variables lenrol and lstaff to the regression from part (i). What happens to the coefficient
on bs? How does the situation compare with that in Table 4.1?
Ketika lenrol dan lstaff ditambahkan ke regresi pert (ii), koefisien pada bs menjadi lebih kecil nilainya
dibandingkan regresi part (i), yaitu −0.605 karena ketika lstaff dan lenroll ditambah maka averae
salary akan berkurang , semain bertambah staff dan penambahan beban yang yang akan di gaji
menjadi lebih banyak pula, sehingga rata-rata gaji menjadi berkurang. Adapun Nilai bs hampir sama
dengan yang ada pada Tabel 4.1,, di mana estimasi regresi −0.605.
(iii) How come the standard error on the bs coefficient is smaller in part (ii) than in part (i)? (Hint:
What happens to the error variance versus multicollinearity when lenrol and lstaff are added?)
Kesalahan standar estimasi regresi sederhana adalah sekitar 0,150 (regresi pertama pada BS), dan
untuk estimasi regresi berganda adalah sekitar 0,109 (regresi kedua pada BS). Ketika kami
menambahkan variabel penjelas tambahan, dua faktor bekerja berlawanan arah pada kesalahan
standar. Multikolinearitas - dalam hal ini, korelasi antara bs dan dua variabel lenrol dan lstaff bekerja
untuk meningkatkan kesalahan standar regresi berganda. Bekerja untuk mengurangi kesalahan
standar ^β bsadalah varians kesalahan yang lebih kecil ketika lenrol dan lstaff dimasukkan dalam
regresi; pada dasarnya, mereka dikeluarkan dari istilah kesalahan regresi sederhana. Dalam contoh
khusus ini, multikolinearitas lebih sederhana dibandingkan dengan pengurangan varians kesalahan.
Faktanya, kesalahan standar dari regresi berubah dari 0,231 untuk regresi sederhana menjadi 0,168
dalam regresi berganda. (Cara lain untuk meringkas penurunan varians kesalahan adalah dengan
mencatat bahwa R-kuadrat berubah dari 0,0151 yang sangat kecil untuk regresi sederhana menjadi
0,4882 untuk regresi berganda.) Tentu saja, sebelumnya kita tidak dapat mengetahui efek mana
yang akan mendominasi, tetapi kita tentu saja dapat membandingkan kesalahan standar setelah
menjalankan kedua regresi
Variabel lstaff adalah catatan jumlah staf per 1.000 siswa. Ketika lstaff meningkat, ada lebih banyak
guru per siswa. Kami dapat mengaitkan ini dengan ukuran kelas yang lebih kecil, yang umumnya
diinginkan dari perspektif guru. Tampaknya, semuanya sama, guru bersedia menerima gaji lebih
sedikit untuk memiliki ukuran kelas yang lebih kecil. Elastisitas gaji sehubungan dengan staf adalah
sekitar 14.714, yang tampaknya cukup besar: peningkatan sepuluh persen dalam ukuran staf
(mempertahankan pendaftaran tetap) dikaitkan dengan gaji yang lebih rendah 7,14 persen.
(v) Now add the variable lunch to the regression. Holding other factors fixed, are teachers being
compensated for teaching students from disadvantaged backgrounds? Explain.
Ketika makan siang ditambahkan ke regresi, koefisiennya adalah sekitar −,00076, dengan t = −4,69.
Oleh karena itu, faktor-faktor lain tetap (bs, lenrol, dan lstaff), tingkat kemiskinan yang disewa
dikaitkan dengan gaji guru yang lebih rendah. Dalam kumpulan data ini, nilai rata-rata makan siang
adalah sekitar 36,3 dengan standar deviasi 25,4. Oleh karena itu, peningkatan satu standar deviasi
dalam makan siang dikaitkan dengan perubahan dalam lsalary sekitar −,00076 (25,4) ≈ −,019, atau
hampir dua persen lebih rendah. Tentu saja tidak ada bukti bahwa guru diberi kompensasi untuk
mengajar anak-anak yang kurang beruntung.
(vi) Overall, is the pattern of results that you find with ELEM94_95 consistent with the pattern in
Table 4.1?
Ya, pola yang diperoleh dengan menggunakan ELEM94_95.RAW sangat mirip dengan pada Tabel 4.1,
dan besarnya cukup dekat juga. Estimasi terbesar (dalam nilai absolut) adalah estimasi regresi
sederhana, dan nilai absolut menurun karena lebih banyak variabel penjelas ditambahkan. Regresi
akhir dalam dua kasus tidak sama, karena kami tidak mengontrol makan siang di Tabel 4.1, dan
tingkat kelulusan dan putus sekolah tidak relevan untuk anak-anak sekolah dasar
C11.
Hasil dari wald-test adalah variabel mother education dan father education sama-sama tidak
memengaruhi education seseorang pada level 5% namun signifikan pada level 10%.
(III)
Hasil penambahan variabel independen tuit 17 dan tuit18
Dependent Variable: EDUC
Method: Least Squares
Date: 12/08/19 Time: 06:02
Sample: 1 1230
Included observations: 1230
Dari hasil regresi diketahui hasil penambahan variabel tuit17 dan tuit18 baik secara terpisah
maupun digabung tidak signifikan mempengaruhi education.
(IV)
hetika variabel tuit17 dan tuit 18 yang dipakai dalam regresi adalah rata-ratanya maka dapat
menunjukkan rata-rata biaya kuliah signifikan mempengaruhi education. Rata-rata digunakan karena
biaya kuliah tahun x dan x-1 dapat digambarkan melalui rata-rata untuk melihat biaya kuliah selama
periode tertentu.
(V) Temuan untuk variabel kuliah rata-rata di bagian (iv) masuk akal ketika diartikan secara kausal
dan mungkin terjadi karena rata-rata menggambarkan populasi. Ketika biaya kuliah per tahun saja
yang di analisis nilai ini dapat menimbukan unconsiten karena biaya kuliah antar tahun pasti
memiliki hubungan korekasi yang tinggi sehingga jika mengunakan rata-rata masalah multikol dapat
teratasi.