Anda di halaman 1dari 48

PEMBAHASAN BUKU WOOLRIDGE

CHAPTER 4
C1 The following model can be used to study whether campaign expenditures affect election

outcomes:
Where voteA is the percentage of the vote received by Candidate A, expend A and expend B are
campaign expenditures by Candidates A and B, and prtystrA is a measure of party strength for
Candidate A (the percentage of the most recent presidential vote that went to A’s party).
(i) What is the interpretation of β 1?
Jawab:

Interpretasi dari β1adalah persentase poin perubahan voteA ketika expendA meningkat sebesar 1%
ceteris paribus.
(ii) In terms of the parameters, state the null hypothesis that a 1% increase in A’s expenditures is
offset by a 1% increase in B’s expenditures.
Jawab:
Mencari H0:
H0 : β 1 + β 2 = 0 atau
H0 : β 2 = - β 1
Jika pengeluaran dana kampanye dari Kandidat A naik sebesar 1%, dan pengeluaran dana kampanye
dari Kandidat B naik sebesar 1%, maka suara atau vote terhadap Kandidat A tidak akan berubah
(tidak naik dan tidak turun) jika kekuatannya sama.
(iii) Estimate the given model using the data in VOTE1 and report the results in usual form. Do A’s
expenditures affect the outcome? What about B’s expenditures? Can you use these results to test
the hypothesis in part (ii).
Jawab:
Dependent Variable: VOTEA
Method: Least Squares
Date: 11/19/19 Time: 11:02
Sample: 1 173
Included observations: 173

Variable Coefficient Std. Error t-Statistic Prob.  

C 45.07893 3.926305 11.48126 0.0000


LOG(EXPENDA) 6.083316 0.382150 15.91866 0.0000
LOG(EXPENDB) -6.615417 0.378820 -17.46321 0.0000
PRTYSTRA 0.151957 0.062018 2.450210 0.0153

R-squared 0.792557    Mean dependent var 50.50289


Adjusted R-squared 0.788874    S.D. dependent var 16.78476
S.E. of regression 7.712335    Akaike info criterion 6.946369
Sum squared resid 10052.14    Schwarz criterion 7.019277
Log likelihood -596.8609    Hannan-Quinn criter. 6.975948
F-statistic 215.2266    Durbin-Watson stat 1.604129
Prob(F-statistic) 0.000000

Koefisien pada log(EXPENDA) dan log(EXPENDB) secara statistik signifikan dibuktikan dengan nilai p-
value yaitu 0,000 (0,000 < α = 5%). Interpretasinya yaitu jika pengeluaran Kandidat A naik sebesar 1%
ceteris paribus maka vote/pilihan kepada Kandidat A akan naik sebesar 0,06083 persentase poin.
Jika pengeluaran Kandidat B naik sebesar 1% ceteris paribus maka vote/pilihan kepada Kandidat A
akan turun sebesar 0,0661 persentase poin.
Ketika koefisien pada log(EXPENDA) dan log(EXPENDB) tandanya berlawanan sesuai ekspektasi,
maka hipotesis yang digunakan seperti pada poin (ii) yaitu H0 : B1 = -B2.

Maka langkah pengerjaannya adalah:


a. Buka eviews > klik eviews workfile

b. Pilih file/direktori file VOTE1


c. Setelah file terbuka, kemudian klik Quick dan Pilih Estimate Equation

d. Masukkan formulasi: “votea c log(expenda) log(expendb) prtystra” kemudian klik OK

e. Setelah itu akan akan didapatkan hasil regresi sebagai berikut:


Dependent Variable: VOTEA
Method: Least Squares
Date: 11/19/19 Time: 11:02
Sample: 1 173
Included observations: 173

Variable Coefficient Std. Error t-Statistic Prob.  

C 45.07893 3.926305 11.48126 0.0000


LOG(EXPENDA) 6.083316 0.382150 15.91866 0.0000
LOG(EXPENDB) -6.615417 0.378820 -17.46321 0.0000
PRTYSTRA 0.151957 0.062018 2.450210 0.0153

R-squared 0.792557    Mean dependent var 50.50289


Adjusted R-squared 0.788874    S.D. dependent var 16.78476
S.E. of regression 7.712335    Akaike info criterion 6.946369
Sum squared resid 10052.14    Schwarz criterion 7.019277
Log likelihood -596.8609    Hannan-Quinn criter. 6.975948
F-statistic 215.2266    Durbin-Watson stat 1.604129
Prob(F-statistic) 0.000000

(iV) Estimate a model that directly gives the t statistic for testing the hypothesis in part (ii). What do
you conclude? (Use a two-sided alternative.).

Untuk mengestimasi model pada poin (ii) yaitu H0 : β 1 + β 2 = 0.


Maka langkah pengerjaannya adalah:
a. Klik Quick dan Pilih Estimate Equation

d. Masukkan formulasi: “votea c (log(expenda)+log(expendb)) prtystra” kemudian klik OK


e. Setelah itu akan akan didapatkan hasil regresi sebagai berikut:

Dependent Variable: VOTEA


Method: Least Squares
Date: 12/03/19 Time: 22:12
Sample: 1 173
Included observations: 173

Variable Coefficient Std. Error t-Statistic Prob.  

C 24.44767 7.850678 3.114084 0.0022


LOG(EXPENDA)+LOG(EXPENDB) -0.320603 0.546921 -0.586196 0.5585
PRTYSTRA 0.587887 0.121375 4.843564 0.0000

R-squared 0.121360    Mean dependent var 50.50289


Adjusted R-squared 0.111023    S.D. dependent var 16.78476
S.E. of regression 15.82561    Akaike info criterion 8.378325
Sum squared resid 42576.47    Schwarz criterion 8.433006
Log likelihood -721.7251    Hannan-Quinn criter. 8.400508
F-statistic 11.74043    Durbin-Watson stat 0.472624
Prob(F-statistic) 0.000017

Simpulannya: Hasil penjumlahan log(expendA) dan log(expendB) menunjukkan tanda koefisien


negatif dan nilai p-value tidak signifikan (0,5585 > α = 0,05), maka dapat diartikan ketika expend A
dan expend B bertambah 1% tidak akan berpengaruh terhadap vote Kandidiat A.
C2 Use the data in LAWSCH85 for this exercise.
(i) Using the sa
rank of law schools has no ceteris paribus effect on median starting salary?
Jawab:
Model yang diestimasi dari Ch. 3 Problem 4 yaitu:

Diminta untuk menentukan dan uji Ho : b5 = 0 dimana ”rank” (ranking dari sekolah hukum) tidak
berpengaruh terhadap gaji.
Maka langkah pengerjaannya adalah:
a. Buka eviews > klik eviews workfile

b. Pilih file/direktori file LAWSCH85

c. Setelah file terbuka, kemudian klik Quick dan Pilih Estimate Equation
d. Masukkan formulasi: “log(salary) c lsat gpa log(libvol) log(cost) rank” kemudian klik OK

e. Setelah itu akan akan didapatkan hasil regresi sebagai berikut:

Dependent Variable: LOG(SALARY)


Method: Least Squares
Date: 12/04/19 Time: 07:02
Sample (adjusted): 1 155
Included observations: 136 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.  

C 8.343226 0.532519 15.66746 0.0000


LSAT 0.004696 0.004010 1.171044 0.2437
GPA 0.247524 0.090037 2.749133 0.0068
LOG(LIBVOL) 0.094993 0.033254 2.856564 0.0050
LOG(COST) 0.037554 0.032106 1.169682 0.2443
RANK -0.003325 0.000348 -9.540787 0.0000

R-squared 0.841685    Mean dependent var 10.54149


Adjusted R-squared 0.835596    S.D. dependent var 0.277240
S.E. of regression 0.112412    Akaike info criterion -1.490183
Sum squared resid 1.642730    Schwarz criterion -1.361684
Log likelihood 107.3324    Hannan-Quinn criter. -1.437964
F-statistic 138.2297    Durbin-Watson stat 1.840975
Prob(F-statistic) 0.000000
Dari hasil estimasi diketahui bahwa koefisien koefisien dari ”rank” sebesar -0,003325 dan p-value
menunjukkan hasil yang signifikan (0,0000 < α = 5%). Interpretasinya yaitu: Jika ranking untuk
sekolah hukum naik sebanyak satu, maka gaji awal akan berkurang sekitar 0,33 persen.
(ii) Are features
significant for explaining salary? (Be sure to account for missing data on LSAT and GPA.)?
Menguji signifikansi koefisien LSAT dan GPA secara parsial dan bersama-sama terhadap salary
Jawab:
Uji Parsial
Dari hasil estimasi poin (i) di atas diketahui bahwa nilai p-value dari “LSAT” menunjukkan hasil tidak
signifikan terhadap gaji (0,2437 > α = 5%). Sedangkan nilai p-value dari ”GPA” menunjukkan hasil
yang signifikan terhadap gaji (0,0068 < α = 5%).
Uji Gabungan/Restristed
Langkah-langkahnya:
a. Buka view > coefficient Diagnostics > Wald Test – Coefficient Restrictions

b. Masukkan formulasi berikut


c(2)=0, c(3)=0
c. Setelah diuji dengan Wald Test, maka didapatkan hasil berikut:
Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic  9.951742 (2, 130)  0.0001


Chi-square  19.90348  2  0.0000

Null Hypothesis: C(2)=0,C(3)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(2)  0.004696  0.004010


C(3)  0.247524  0.090037

Restrictions are linear in coefficients.

Variabel GPA signifikan dengan nilai p-value pada C(2) sebesar 0,004. Secara gabungan nilai F-
statistic sebesar 9,95 dengan (2, 130 degree of fredoom) dan nilai p-value menunjukkan bahwa
signifikan (0,0001 < α = 5%). Hal tersebut menunjukkan bahwa variabel lsat dan gpa secara bersama-
sama signifkan berpengaruh terhadap gaji pada tingkat signifikansi 5%.

(iii) Test whethe


added to this equation; carry out a single test. (Be careful to account for missing data on clsize and
faculty.)
Jawab:
Diminta untuk menilai apakah perlu tambahan variabel ”clsize” dan ”faculty” dalam model regresi.

Maka langkah pengerjaannya adalah:


a. Setelah file terbuka, kemudian klik Quick dan Pilih Estimate Equation
d. Masukkan formulasi: “log(salary) c lsat gpa log(libvol) log(cost) rank clsize faculty” kemudian klik
OK

e. Setelah itu akan akan didapatkan hasil regresi sebagai berikut:


Dependent Variable: LOG(SALARY)
Method: Least Squares
Date: 12/04/19 Time: 07:56
Sample (adjusted): 1 155
Included observations: 131 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.  

C 8.415897 0.552253 15.23920 0.0000


LSAT 0.005582 0.004180 1.335547 0.1842
GPA 0.266067 0.093250 2.853275 0.0051
LOG(LIBVOL) 0.055158 0.040400 1.365283 0.1747
LOG(COST) 0.029672 0.034683 0.855513 0.3939
RANK -0.003428 0.000357 -9.593658 0.0000
CLSIZE 0.000134 0.000154 0.874062 0.3838
FACULTY 6.75E-05 0.000400 0.168720 0.8663

R-squared 0.843984    Mean dependent var 10.54013


Adjusted R-squared 0.835105    S.D. dependent var 0.278504
S.E. of regression 0.113093    Akaike info criterion -1.462095
Sum squared resid 1.573162    Schwarz criterion -1.286510
Log likelihood 103.7672    Hannan-Quinn criter. -1.390747
F-statistic 95.05463    Durbin-Watson stat 1.765531
Prob(F-statistic) 0.000000

f. Kemudian buka view > coefficient Diagnostics > Wald Test – Coefficient Restrictions

g. Masukkan formulasi berikut


c(7)=0,c(8)=0
h. Setelah diuji dengan Wald Test, maka didapatkan hasil berikut:

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic  0.948369 (2, 123)  0.3902


Chi-square  1.896739  2  0.3874

Null Hypothesis: C(7)=0,C(8)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(7)  0.000134  0.000154


C(8)  6.75E-05  0.000400

Restrictions are linear in coefficients.


Secara gabungan nilai F-statistic sebesar 0,95 dengan (2, 123 degree of fredoom) dan nilai p-value
menunjukkan bahwa tidak signifikan (0,3902 > α= 5%). Hal tersebut menunjukkan bahwa variabel
clsize dan faculty secara bersama-sama tidak signifkan berpengaruh terhadap gaji pada tingkat
signifikansi 5% atau bahkan tingkat signifikansi 10% sekalipun.

(iv) What factor


regression?
Jawab:
Jika hanya ingin menentukan pengaruh ranking sekolah hukum pada gaji pada awalnya, kita harus
mengendalikan faktor-faktor lain yang mempengaruhi gaji dan peringkat. Skor LSAT dan IPK mungkin
merupakan variabel kontrol yang baik untuk menilai kualitas siswa. Namun, jika ada perbedaan jenis
kelamin dan komposisi ras di seluruh sekolah, dan perbedaan gender dan ras yang sistematis dalam
gaji, kita juga bisa mengendalikannya.
Namun, tidak jelas mengapa ini akan berkorelasi dengan pangkat. Kualitas fakultas, mungkin diukur
dengan catatan publikasi, dapat dimasukkan. Hal-hal semacam itu memang masuk peringkat hukum
sekolah.

C3 Refer to Computer Exercise C2 in Chapter 3. Now, use the log of the housing price as the
dependent variable:
log(price) = β 0 + β 1sqrft + β 2bdrms + u.
(i) You are interested in estimating and obtaining a confidence interval for the percentage change in
price when a 150-square-foot bedroom is added to a house. In decimal form, this is u1 5 150b1 1 b2.
Use the data in HPRICE1.RAW to estimate θ1.
(ii) Write b2 in terms of u1 and b1 and plug this into the log(price) equation.
(ii) Use part (ii) to obtain a standard error for θ1 and use this standard error to construct a 95%
confidence interval.
JAWAB
log(price) c sqrft bdrms
Dependent Variable: LOG(PRICE)
Method: Least Squares
Date: 11/27/19 Time: 10:24
Sample: 1 88
Included observations: 88

Variable Coefficient Std. Error t-Statistic Prob.  

C 4.766027 0.097044 49.11178 0.0000


SQRFT 0.000379 4.32E-05 8.781028 0.0000
BDRMS 0.028884 0.029643 0.974403 0.3326

R-squared 0.588295    Mean dependent var 5.633180


Adjusted R-squared 0.578608    S.D. dependent var 0.303573
S.E. of regression 0.197063    Akaike info criterion -0.377086
Sum squared resid 3.300889    Schwarz criterion -0.292631
Log likelihood 19.59178    Hannan-Quinn criter. -0.343061
F-statistic 60.72921    Durbin-Watson stat 1.806794
Prob(F-statistic) 0.000000

(i) model log(price)= 4,766 + 0,000379 sqrft + 0,028884 bdrms


n = 88, R2 = 0,588
estimasi persentase perubahan price jika ada penambahan 150 square foot
θ^ 1=150 β 1+ β 2
θ^ 1=150 (0,000379)❑+0,028884=0,085734 atau 8,57%
(i) model log(price)= β 0+ β 1sqrft + β 2bdrms +u
β 2=θ1−150 β 1 maka
log(price)= β 0+ β 1sqrft +( θ1−150 β 1 )bdrms +u
log ( price )=β 0 + β 1 (sqrft −150 bdrms¿)+ɵ 1 bdrms+u ¿

(iiI) Dari hasil regresi (ii) , tentukan standar error θ1 dan gunakan standar error tersebut untuk
membentuk confidence interval dengan tingkat kepercayaan 95 persen.
log(price) c (sqrft-150*bdrms) bdrms
Dependent Variable: LOG(PRICE)
Method: Least Squares
Date: 11/28/19 Time: 08:38
Sample: 1 88
Included observations: 88

Variable Coefficient Std. Error t-Statistic Prob.  

C 4.766027 0.097044 49.11178 0.0000


SQRFT-150*BDRMS 0.000379 4.32E-05 8.781028 0.0000
BDRMS 0.085801 0.026768 3.205429 0.0019

R-squared 0.588295    Mean dependent var 5.633180


Adjusted R-squared 0.578608    S.D. dependent var 0.303573
S.E. of regression 0.197063    Akaike info criterion -0.377086
Sum squared resid 3.300889    Schwarz criterion -0.292631
Log likelihood 19.59178    Hannan-Quinn criter. -0.343061
F-statistic 60.72921    Durbin-Watson stat 1.806794
Prob(F-statistic) 0.000000

log ( price )=4,766027+0,000379( sqrft −150 bdrms)+0,085801 bdrms+u


(0,097044) (0,0000432) (0,026768)

n = 88
R2=0,588295
standar error (θ^ 1) = 0,026768

Dengan tingkat kepercayaan 95 persen, maka Confidence interval θ^ 1yang terbentuk adalah sebagai
berikut
Select View/Coefficient Diagnostics/Confidence Intervals

Coefficient Confidence Intervals


Date: 11/28/19 Time: 09:06
Sample: 1 88
Included observations: 88

90% CI 95% CI
Variable Coefficient Low High Low High

C  4.766027  4.604644  4.927410  4.573077  4.958978


SQRFT-150*BDRMS  0.000379  0.000308  0.000451  0.000294  0.000465
BDRMS  0.085801  0.041288  0.130315  0.032580  0.139022

Secara manual juga dapat dihitung sebagai berikut :

θ^ 1−t 0,025,85¿ se ( θ^ 1)<ɵ1 < ɵ̇1+ t 0,025,85 ¿ se( θ^ 1)


0,085801−1,99 ¿ 0,026768<¿❑ θ^ 1< 0,085801+ 1,99¿ 0,026768 ¿
0,0326¿ θ^ 1 <¿0,139

Dapat disimpulkan dengan tingkat kepercayaan 95 persen, nilai parameter θ^ 1 berada diantara nilai

0,0326 dan 0,139. Oleh karena dari hasil estimasi nilai θ^ 1 sebesar 0,085801 dan nilai parameter
berada didalam interval, dapat diartikan bahwa dengan tingkat kepercayaan 95 persen variabel
jumlah kamar (bdrms) signifikan mempengaruhi harga rumah.

C4 In Example 4.9, the restricted version of the model can be estimated using all 1,388 observations
in
the sample. Compute the R-squared from the regression of bwght on cigs, parity, and faminc using
all
observations. Compare this to the R-squared reported for the restricted model in Example 4.9.
bwght c cigs parity faminc motheduc fatheduc

Dependent Variable: BWGHT


Method: Least Squares
Date: 11/28/19 Time: 09:30
Sample: 1 1388
Included observations: 1191

Variable Coefficient Std. Error t-Statistic Prob.  

C 114.5243 3.728453 30.71631 0.0000


CIGS -0.595936 0.110348 -5.400524 0.0000
PARITY 1.787603 0.659406 2.710932 0.0068
FAMINC 0.056041 0.036562 1.532794 0.1256
MOTHEDUC -0.370450 0.319855 -1.158182 0.2470
FATHEDUC 0.472394 0.282643 1.671345 0.0949

R-squared 0.038748    Mean dependent var 119.5298


Adjusted R-squared 0.034692    S.D. dependent var 20.14124
S.E. of regression 19.78878    Akaike info criterion 8.813133
Sum squared resid 464041.1    Schwarz criterion 8.838737
Log likelihood -5242.220    Hannan-Quinn criter. 8.822781
F-statistic 9.553500    Durbin-Watson stat 1.911657
Prob(F-statistic) 0.000000

bwght c cigs parity faminc

Dependent Variable: BWGHT


Method: Least Squares
Date: 11/28/19 Time: 09:37
Sample: 1 1388
Included observations: 1388

Variable Coefficient Std. Error t-Statistic Prob.  


C 114.2143 1.469300 77.73383 0.0000
CIGS -0.477154 0.091518 -5.213769 0.0000
PARITY 1.616372 0.603955 2.676312 0.0075
FAMINC 0.097920 0.029187 3.354946 0.0008

R-squared 0.034800    Mean dependent var 118.6996


Adjusted R-squared 0.032708    S.D. dependent var 20.35396
S.E. of regression 20.01833    Akaike info criterion 8.834051
Sum squared resid 554615.2    Schwarz criterion 8.849140
Log likelihood -6126.832    Hannan-Quinn criter. 8.839694
F-statistic 16.63327    Durbin-Watson stat 1.922226
Prob(F-statistic) 0.000000

R-kuadrat dari bwght regresi pada cigs, parity, dan faminc, menggunakan semua 1.388 pengamatan,
adalah sekitar 0,0348. Ini berarti bahwa, jika kita secara keliru menggunakan ini menggantikan
0,0364, yang merupakan kuadrat-R yang menggunakan 1.191 pengamatan yang sama yang tersedia
dalam regresi tidak terbatas, kita akan memperoleh:
(0,0348−0,0387) 1.185
F= x ≈ 2,40
(1−0,0387) 2
yang menghasilkan nilai-p 0,091 dalam distribusi F dengan 2 dan 1, 1185 df. Ini signifikan pada level
10%, tetapi tidak benar. Statistik F yang benar dihitung sebagai 1,42 pada Contoh 4.9, dengan nilai p
≈ 0,242

C5 Use the data in MLB1 for this exercise.


i. Use the mod
statistical significance of hrunsyr? What about the size of the coefficient on hrunsyr?
log ( salary ) =β 0+ β 1 years+ β2 gamesyr+ β3 bavg+ β 4 hrunsyr + β 5 rbisyr +u
ii. Add the vari
per year) to the model from part (i). Which of these factors are individually significant?
iii. In the mode
Jawaban
i. Use the mod
statistical significance of hrunsyr? What about the size of the coefficient on hrunsyr?
log ( salary ) =β 0+ β 1 years+ β2 gamesyr+ β3 bavg+ β 4 hrunsyr + β 5 rbisyr +u

Steps: 1
Steps: 2

Steps: 3

Without rbisyr With rbisyr

Dependent Variable: LOG(SALARY) Dependent Variable: LOG(SALARY)


Method: Least Squares Method: Least Squares
Date: 12/04/19 Time: 07:30 Date: 12/04/19 Time: 07:33
Sample: 1 353 Sample: 1 353
Included observations: 353 Included observations: 353

Variable Coefficient Std. Error t-Statistic Prob.   Variable Coefficient Std. Error t-Statistic Prob.  

C 11.02091 0.265719 41.47580 0.0000 C 11.19242 0.288823 38.75184 0.0000


YEARS 0.067732 0.012113 5.591798 0.0000 YEARS 0.068863 0.012115 5.684295 0.0000
GAMESYR 0.015759 0.001564 10.07889 0.0000 GAMESYR 0.012552 0.002647 4.742440 0.0000
BAVG 0.001419 0.001066 1.330995 0.1841 BAVG 0.000979 0.001104 0.886811 0.3758
HRUNSYR 0.035943 0.007241 4.963997 0.0000 HRUNSYR 0.014429 0.016057 0.898643 0.3695
RBISYR 0.010766 0.007175 1.500458 0.1344
    Mean dependent
R-squared 0.625388 var 13.49218     Mean dependent
Adjusted R-     S.D. dependent R-squared 0.627803 var 13.49218
squared 0.621082 var 1.182466 Adjusted R-     S.D. dependent
S.E. of     Akaike info squared 0.622440 var 1.182466
regression 0.727882 criterion 2.216709 S.E. of     Akaike info
Sum regression 0.726577 criterion 2.215907
squared Sum squared
resid 184.3749    Schwarz criterion 2.271474 resid 183.1863    Schwarz criterion 2.281626
Log     Hannan-Quinn Log     Hannan-Quinn
likelihood -386.2491 criter. 2.238500 likelihood -385.1076 criter. 2.242057
    Durbin-Watson     Durbin-Watson
F-statistic 145.2403 stat 1.244041 F-statistic 117.0603 stat 1.265390
Prob(F- Prob(F-
statistic) 0.000000 statistic) 0.000000

Model yang terbentuk


log(salary)= 11 ,02 + 0,0677 yesras + 0,0158 gamesyr - 0,0014 bavg + 0,0359 hrunsyr
variabel hrunsyr signifikan memengaruhi salary (p-value<0,05). Setiap kenaikan 1 satuan hrunsyr
akan menyebabkan gaji naik 3,5% (0,0359*100%)

ii.
Add the variables runsyr (runs per year), fldperc (fielding percentage), and sbasesyr (stolen bases per
year) to the model from part (i). Which of these factors are individually significant?

Steps: 1

Steps: 2
-
Steps: Output

Dependent Variable: LOG(SALARY)


Method: Least Squares
Date: 12/04/19 Time: 07:51
Sample: 1 353
Included observations: 353

Variable Coefficient Std. Error t-Statistic Prob.  

C 10.40827 2.003255 5.195679 0.0000


YEARS 0.069985 0.011976 5.843968 0.0000
GAMESYR 0.007900 0.002677 2.950374 0.0034
BAVG 0.000530 0.001104 0.479825 0.6317
HRUNSYR 0.023211 0.008639 2.686673 0.0076
RUNSYR 0.017392 0.005064 3.434429 0.0007
FLDPERC 0.001035 0.002005 0.516357 0.6059
SBASESYR -0.006419 0.005184 -1.238212 0.2165

R-squared 0.639021    Mean dependent var 13.49218


Adjusted R-squared 0.631697    S.D. dependent var 1.182466
S.E. of regression 0.717615    Akaike info criterion 2.196635
Sum squared resid 177.6651    Schwarz criterion 2.284260
Log likelihood -379.7061    Hannan-Quinn criter. 2.231502
F-statistic 87.24772    Durbin-Watson stat 1.287201
Prob(F-statistic) 0.000000

Model yang terbentuk


log(salary)= 10.40827+ 0.069985yesras + 0.007900gamesyr + 0.023211hrunsyr + 0.017392 runsyr

ketika variabell runsyr (runs per year), fldperc (fielding percentage), and sbasesyr (stolen bases per
year) dimasukkan ke dalam model, hanya variabel runsyr yang signifikan memengaruhi gaji (P-
value<0,05). Ketika variable runsyr naik 1 pelari per tahun akan menyebabkan gaji naik 1,74%
(0,017392*100%)
iii. In the mode
Wald Test:
Equation: Untitled

Test Statistic Value df Probability

t-statistic -0.834171  345  0.4048


F-statistic  0.695841 (1, 345)  0.4048
Chi-square  0.695841  1  0.4042

Null Hypothesis: C(4)+C(7)+C(8)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(4) + C(7) + C(8) -0.004854  0.005819

Restrictions are linear in coefficients.

Ho: b3+b6+b8=0
H1: b3+b6+b8≠0
Kesimpulan : Tidak Tolak H0, Ketika menguji variabel bavg, fldperc, dan sbasesyr secara bersama
sama diperloreh hasi bahwa secara bersama-masa variabel ini tidak memengaruhi gaji dilihat dari uji
F dan Chi-square (p-value>0,05)

C6 Use the data in WAGE2 for this exercise.

Jawaban
1. Consider the
log ( wage )=β 0+ β1 educ + β 2 exper + β3 tenure+ u
State the null hypothesis that another year of general workforce experience has the same effect on
log(wage) as another year of tenure with the current employer.
Ho: b2=b3
H1: b2≠ b3
Steps: 1
Steps 2:

Steps: Output
Dependent Variable: LWAGE
Method: Least Squares
Date: 12/04/19 Time: 08:54
Sample: 1 935
Included observations: 935

Variable Coefficient Std. Error t-Statistic Prob.  

C 5.496696 0.110528 49.73115 0.0000


EDUC 0.074864 0.006512 11.49549 0.0000
EXPER 0.015328 0.003370 4.549086 0.0000
TENURE 0.013375 0.002587 5.169615 0.0000

R-squared 0.155112    Mean dependent var 6.779004


Adjusted R-squared 0.152390    S.D. dependent var 0.421144
S.E. of regression 0.387729    Akaike info criterion 0.947250
Sum squared resid 139.9610    Schwarz criterion 0.967958
Log likelihood -438.8394    Hannan-Quinn criter. 0.955146
F-statistic 56.97386    Durbin-Watson stat 1.769343
Prob(F-statistic) 0.000000
Steps: 4

Steps: 5

Steps: Output

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic  31.78796 (2, 931)  0.0000


Chi-square  63.57591  2  0.0000

Null Hypothesis: C(3) = C(4) = 0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(3)  0.015328  0.003370


C(4)  0.013375  0.002587

Restrictions are linear in coefficients.


Dari hasil uji wald diperoleh bahwa experience dan tenure signifikan,sama-sama memengaruhi gaji
(F statistik, p-value<0,05)

Dependent Variable: LOG(WAGE)


Method: Least Squares
Date: 11/19/19 Time: 12:04
Sample: 1 935
Included observations: 935

Variable Coefficient Std. Error t-Statistic Prob.  

C 6.033876 0.089059 67.75137 0.0000


EDUC 0.056591 0.006266 9.031545 0.0000
EXPER-TENURE -0.003943 0.002358 -1.672205 0.0948

R-squared 0.100117    Mean dependent var 6.779004


Adjusted R-squared 0.098186    S.D. dependent var 0.421144
S.E. of regression 0.399935    Akaike info criterion 1.008173
Sum squared resid 149.0713    Schwarz criterion 1.023704
Log likelihood -468.3207    Hannan-Quinn criter. 1.014095
F-statistic 51.84493    Durbin-Watson stat 1.772066
Prob(F-statistic) 0.000000

Variabel exper-tenure tidak signifikan memengaruhi gaji pada level 5% namun signifikan pada level
10%.

C7 Refer to the example used in Section 4-4. You will use the data set TWOYEAR.
(i) The variable
example, 90 means you are ranked better than 90 percent of your graduating class.) Find the
smallest, largest, and average phsrank in the sample.

Jawab
Phsrank adalah persentil dari siswa anak Sekolah Menengah Atas
Untuk mencari nilai terkeccil, terbesar dan rata rata dari phsrrank dalam sampel,
langkahnya:

Berdasarkan hasil olah dengan menggunakan analisis statisti deskriptif diperoleh:


Nilai terkecil dari variabel phsrank : 00.00
Nilai terbesar dari variabel phsrank :99.00
Nilai rata-rata dari variabel phsrank : 56.157
(ii) Add phsrank
statistically significant? How much is 10 percentage points of high school rank worth in
terms of wage?

Jawab
Log(wage) =β0+θ1jc+β2 totcoll+β3 exper+β4 phsrank+u
Jc = number of years attending a two-year college
Totcoll = jc+univ
Exper = months in the workforce

Dependent Variable: LWAGE


Method: Least Squares
Date: 11/28/19 Time: 14:22
Sample: 1 6763
Included observations: 6763

Variable Coefficient Std. Error t-Statistic Prob.  

C 1.458747 0.023621 61.75602 0.0000


JC -0.009311 0.006969 -1.335970 0.1816
TOTCOLL 0.075476 0.002559 29.49615 0.0000
EXPER 0.004940 0.000158 31.36034 0.0000
PHSRANK 0.000303 0.000239 1.269154 0.2044

R-squared 0.222627    Mean dependent var 2.248096


Adjusted R-squared 0.222167    S.D. dependent var 0.487692
S.E. of regression 0.430119    Akaike info criterion 1.151229
Sum squared resid 1250.246    Schwarz criterion 1.156271
Log likelihood -3887.881    Hannan-Quinn criter. 1.152969
F-statistic 483.8461    Durbin-Watson stat 1.968428
Prob(F-statistic) 0.000000

Baik dengan α (tingkat signifikansi) 5% atau 10% variabel phsrank tidak signifikan secara statistik.
Dapat dilihat pada nilai probabiltitanya (0.2044<α) Jika kita menaikkan nilai phsrank sebesar 10,
maka nilai dari log(wage) meningkat sebesar [10*0.000303] = 0.00303. Ini menyiratkan peningkatan
variabel phsrank sebesar 10% akan menyebabkan peningkatan upah sebesar 0.3% (Namun, standar
deviasi sampel phsrank adalah sekitar 24)

(ii) Does adding phsrank to (4.26) substantively change the conclusions on the returns to two- and
four-year colleges? Explain.

Jawab
Menambahkan phsrank membuat statistik t pada jc bahkan lebih kecil dalam nilai absolut,
sekitar 1,33, tetapi besarnya koefisien mirip dengan (4,26). Oleh karena itu, titik dasar tetap
tidak berubah: kembalinya ke perguruan tinggi junior diperkirakan agak lebih kecil, tetapi
perbedaannya tidak signifikan dan standar tingkat signifikan

(iii) The data set


you expect it to be statistically insignificant. What is the two-sided p-value?
Jawab
Alasan kenapa menambah variabel id ke dalam persamaan (4.17) atau (4.26) tidak akan
signifikan, karena variabel id adalah nomor untuk mengidentifikasi sampel pekerja yang
sifatnya random. Sehingga variabel id tidak boleh dikoelasikan dengan variabel apapun. Jika
variabel id ditambahkan baikke persamaan (4.17) ataupun (4.26) seharusnya tidak signiikan.
Setelah variabel id dimasukan kedalam persamaan (4.170 ataupun (4.26) memang tidak
sgnifikan.

C8 The data set 401KSUBS contains information on net financial wealth (nettfa), age of the
survey respondent (age), annual family income (inc), family size (fsize), and participation in
certain pension plans for people in the United States. The wealth and income variables are
both recorded in thousands of dollars. For this question, use only the data for single-person
households (so fsize 5 1).
(i) How many s
Jawab
Dari 9,275 sampel rumah tangga, terdapat 2,017 rumah tangga yang memiliki jumlah anggota rumah
tangga 1 orang.
(ii) Use OLS to e
nettfa = β0 +β1inc + β2 age + u,
and report the results using the usual format. Be sure to use only the single-person households in
the sample. Interpret the slope coefficients. Are there any surprises in the slope estimates?
Dependent Variable: NETTFA
Method: Least Squares
Date: 11/29/19 Time: 11:25
Sample: 1 9275 IF FSIZE=1
Included observations: 2017

Variable Coefficient Std. Error t-Statistic Prob.  

C -43.03981 4.080393 -10.54796 0.0000


INC 0.799317 0.059731 13.38200 0.0000
AGE 0.842656 0.092017 9.157631 0.0000

R-squared 0.119343    Mean dependent var 13.59498


Adjusted R-squared 0.118469    S.D. dependent var 47.59058
S.E. of regression 44.68275    Akaike info criterion 10.43854
Sum squared resid 4021048.    Schwarz criterion 10.44688
Log likelihood -10524.27    Hannan-Quinn criter. 10.44160
F-statistic 136.4648    Durbin-Watson stat 1.959509
Prob(F-statistic) 0.000000

Model yang terbentuk:


nettfa = -43.03981 +0.799317 inc +0.842656 age

Koefisien inc sebesar 0.799317 berarti peningkatan $1000 inc (annual family income) menyebabkan
peningkatan nettfa (net financial wealth) sebesar $799.317, cateris paribus. Koefisien age sebesar
0.842656 berarti peningkatan 1 satuan variabel age (age of the survey respondent) meyebabkan
peningkatan nettfa (net financial wealth) sebesar $843, cateris paribus. Dari nilai slope untuk
variabel inc dan age tidak ada nilai yang mengejutkan karena sesuai dengan teori.
(iii) Does the int

Jawab:
Nilai intersep sebesar -43.04 berarti jika usia responden 0 tahun dan tidak memiliki pendapatan
maka nilai dari nettfa -43.04. Nilai intersep tersebut tidak bermakna karena tidak ada jangkauan nilai
variabel bebas memasukan 0 sebagai salah satu nilai yang diamati.
(iv) Find the p-value for the test H0: β2= 1 against H1: β2 < 1. Do you

reject H0 at the 1% significance level?

Jawab:
H0: β2= 1

H1: β2 < 1

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

t-statistic -1.709944  2014  0.0874


F-statistic  2.923908 (1, 2014)  0.0874
Chi-square  2.923908  1  0.0873

Null Hypothesis: C(3)=1


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

-1 + C(3) -0.157344  0.092017

Restrictions are linear in coefficients.

Jadi untuk menentukan keputusan apakah tolak H0 atau tidak tolak H0 memakai
rumus di bawah ini karena one tail:
t stat= ¿^¿-β2)/Se( ^
β 2 ¿= (0.843−1)/ 0.092= -1.71

t tabel= t(1-α;n-2) nilainya cenderung lebih dari t stat, jadi keputusannya adalah
tolak H0
(v) If you do a simple regression of nettfa on inc, is the estimated coefficient on
inc much different from the estimate in part (ii)? Why or why not?
Dependent Variable: NETTFA
Method: Least Squares
Date: 12/08/19 Time: 20:36
Sample: 1 9275 IF FSIZE=1
Included observations: 2017

Variable Coefficient Std. Error t-Statistic Prob.  

C -10.57095 2.060678 -5.129843 0.0000


INC 0.820681 0.060900 13.47589 0.0000

R-squared 0.082673    Mean dependent var 13.59498


Adjusted R-squared 0.082218    S.D. dependent var 47.59058
S.E. of regression 45.59223    Akaike info criterion 10.47834
Sum squared resid 4188483.    Schwarz criterion 10.48390
Log likelihood -10565.41    Hannan-Quinn criter. 10.48038
F-statistic 181.5995    Durbin-Watson stat 1.914495
Prob(F-statistic) 0.000000

KOefisien slope variabel inc pada simple regression adalah 0.821, tidak terlalu berbeda dg koefisien
slope pada model multiple regression yaitu 0.799. Dan setelah dilihat korelasi antara variabel inc dan
age adalah sebesar 0.039, ini menjelaskan bahwa kenapa pada simple dan multiple regression nilai
estimasi untuk koefisien slope variabel inc tidak berbeda.

C9. Use the data in DISCRIM to answer this question. These are ZIP code–level data on prices for
various items at fast-food restaurants, along with characteristics of the zip code population, in New
Jersey and Pennsylvania. The idea is to see whether fast-food restaurants charge higher prices in
areas with a larger concentration of blacks
(i) Find the average values of prpblck and income in the sample, along with their
standard deviations. What are the units of measurement of prpblck and income?
Jawab : buka data DISCRIM di Eviews 9 kemudian klik quick Group statistic Descriptive
stastistics  common samplel

Setelah itu aka muncul tampilan seperti di bawah ini, kemudian masukkan variable yang akan
dihitung mean dan std deviasinya, klik ok.

Kemudian akan kelur hasilnya seperti di bawah ini

PRPBLCK INCOME
 Mean  0.113486  47053.78
 Median  0.041444  46272.00
 Maximum  0.981658  136529.0
 Minimum  0.000000  15919.00
 Std. Dev.  0.182416  13179.29
 Skewness  2.700012  0.962831
 Kurtosis  10.56841  7.551386

 Jarque-Bera  1473.100  416.2135


 Probability  0.000000  0.000000

 Sum  46.41594  19244998


 Sum Sq. Dev.  13.57651  7.09E+10

 Observations  409  409

Dari hasil analisis statistic deskriptif di atas, diperoleh rata-rata nilai dari prpblck dan income dengan
standar deviasi sebagai berikut:
 Rata-rata Pr
pos) adalah 0.1135 dengan standar deviasi 0.1824 yang dilakukan pada jumlah observasi/ jumlah
sampel sebanyak 409.
 Rata-rata Inc
47053.78 dengan standar deviasi 13179.29 yang dilakukan pada jumlah observasi/jumah sampel
sebanyak 409.

(ii) Consider a m
that is black and median income:
psoda= β0 + β 1 prpblck + β 2 income +u
Estimate this model by OLS and report the results in equation form, including the sample size and R-
squared. (Do not use scientific notation when reporting the estimates.) Interpret the coefficient on
prpblck. Do you think it is economically large?

Setelah data DISCRIM dibuka, maka akan keluar tampilan di bawah, klik quick  Estimate equation
Setelah itu, akan muncul tampilan seperti di bawah, masukkan variabel yang akan di regres sesuai
soal yang diminta, yakni
psoda= β0 + β 1 prpblck + β 2 income +u

Klik ok, maka akan keluar hasil regresi seperti di bawah ini

Dependent Variable: PSODA


Method: Least Squares
Date: 11/17/19 Time: 09:51
Sample: 1 410
Included observations: 401

Variable Coefficient Std. Error t-Statistic Prob.  

C 0.956320 0.018992 50.35379 0.0000


PRPBLCK 0.114988 0.026001 4.422515 0.0000
INCOME 1.60E-06 3.62E-07 4.430130 0.0000

R-squared 0.064220     Mean dependent var 1.044863


Adjusted R-squared 0.059518     S.D. dependent var 0.088798
S.E. of regression 0.086115     Akaike info criterion -2.058820
Sum squared resid 2.951465     Schwarz criterion -2.028940
Log likelihood 415.7934     Hannan-Quinn criter. -2.046988
F-statistic 13.65691     Durbin-Watson stat 1.696180
Prob(F-statistic) 0.000002

Model yang diperoleh


Psoda = 0.956320 + 0.114988 pprblck + 0,0000016 income
Uji Parsial terhadap b0
Ho: b0=0
H1: b0≠0
α = 5%
Keputusan Tolak H0 jika nilai Prob < α = 5%
Karena nilai prob = 0.000, Maka keputusan adalah Tolak H 0
Kesimpulan: Dengan tingkat kepercayaan 5% b 0 signifikan mempengaruhi harga soda
Uji Parsial terhadap b1
Ho: b1=0
H1: b1≠0
α = 5%
Keputusan Tolak H0 jika nilai Prob < α = 5%
Karena nilai prob = 0.000, Maka keputusan adalah Tolak H 0
Kesimpulan: Dengan tingkat kepercayaan 5% b 1 / proporsi banyaknya orang hitam disuatu wilayah
berdasarkan kodepos signifikan mempengaruhi
harga soda
Uji Parsial terhadap b2
Ho: b2=0
H1: b2≠0
α = 5%
Keputusan Tolak H0 jika nilai Prob < α = 5%
Karena nilai prob = 0.000, Maka keputusan adalah Tolak H 0
Kesimpulan: Dengan tingkat kepercayaan 5% b 2/income signifikan mempengaruhi harga soda
Pengujian Simultan
Ho: b0= b1= b2=0
H1: min ada 1 koefisien b ≠0
α = 5%
Keputusan Tolak H0 jika nilai Prob < α = 5%
Karena nilai prob ( F-statistic)= 0.000002, Maka keputusan adalah Tolak H 0
Kesimpulan secara bersama-sama koefisien b1/ proporsi orang hitam dan b 2/ income signifikan
mempengaruhi harga soda
Arti koefisien beta
b1 (proporsi orang hitam) =0.114988 Setiap kenaikan 1 satuan proporsi orang hitam dalam suatu
wilayah berdasarkan kodepos, maka harga soda meningkat sebesar 0.115 satuan, cateris paribus.
b2(Pendapatan)= 0.0000016 Setiap kenaikan 1 satuan income/pendapatan maka harga soda
meningkat sebesar 0.0000016 satuan, cateris paribus.
Arti koefisien R2 = 6.42%
Sebesar 6.42% variasi dalam variabel Y (harga soda) dapat dijelaskan oleh variabel X (proporsi orang
hitam dan pendapatan), sisanya sebesar 93.58% dijelaskan oleh variabel lain.

(iii) Compare the


Is the discrimination effect larger or smaller when you control for income?
Dengan tampilan yang tadi, klik estimate  masukkan variabel yang akan di regres dan klik ok
Dependent Variable: PSODA
Method: Least Squares
Date: 11/17/19 Time: 11:03
Sample: 1 410
Included observations: 401

Variable Coefficient Std. Error t-Statistic Prob.  

C 1.037399 0.005190 199.8668 0.0000


PRPBLCK 0.064927 0.023957 2.710146 0.0070

R-squared 0.018076     Mean dependent var 1.044863


Adjusted R-squared 0.015615     S.D. dependent var 0.088798
S.E. of regression 0.088102     Akaike info criterion -2.015673
Sum squared resid 3.097007     Schwarz criterion -1.995753
Log likelihood 406.1425     Hannan-Quinn criter. -2.007785
F-statistic 7.344894     Durbin-Watson stat 1.611081
Prob(F-statistic) 0.007015

psoda=1,037 +0,065 prpblck

Dengan menggunakan income sebagai variable penjelas yang diregresikan secara simultan dengan
prpblck nilai β 1 = 0,1149 sedangkan bila tanpa menggunakan income sebagai variabel penjelas nilai
β 1 = 0,0649. Terjadi penurunan koefisien berdampak pada penurunan harga soda pada suatu
wilayah. Menurut saya, diskriminasi efek menjadi lebih kecil dengan tidak melibatkan variabel
income di dalam regresi karena hanya memperhatikan proporsi jumlah orang kulit hitamnya dalam
suatu wilayah saja.
(iv) A model wit
estimates of the model
log ⁡( psoda)=β 0+ β1 prpblck + β 2 log ⁡(income)+u

If prpblck increases by 0.20 (20 percentage points), what is the estimated percentage change in
psoda? (Hint: The answer is 2.xx, where you fill in the “xx.”)

Hasil Regresi
Dependent Variable: LOG(PSODA)
Method: Least Squares
Date: 11/17/19 Time: 11:16
Sample: 1 410
Included observations: 401

Variable Coefficient Std. Error t-Statistic Prob.  

C -0.793768 0.179434 -4.423738 0.0000


PRPBLCK 0.121580 0.025746 4.722349 0.0000
LOG(INCOME) 0.076511 0.016597 4.609987 0.0000

R-squared 0.068092     Mean dependent var 0.040299


Adjusted R-squared 0.063409     S.D. dependent var 0.084834
S.E. of regression 0.082101     Akaike info criterion -2.154287
Sum squared resid 2.682730     Schwarz criterion -2.124407
Log likelihood 434.9345     Hannan-Quinn criter. -2.142455
F-statistic 14.54045     Durbin-Watson stat 1.696109
Prob(F-statistic) 0.000001

Kenaikan 0.20 (20%) pada prpblck menyebabkan psoda naik sebesar = 0.20 x (0.121580) =0.024316
atau 2.4316%

(v) Now add the


Hasil Regresi
Dependent Variable: LOG(PSODA)
Method: Least Squares
Date: 11/17/19 Time: 11:24
Sample: 1 410
Included observations: 401

Variable Coefficient Std. Error t-Statistic Prob.  

C -1.463332 0.293711 -4.982216 0.0000


PRPBLCK 0.072807 0.030676 2.373458 0.0181
LOG(INCOME) 0.136955 0.026755 5.118780 0.0000
PRPPOV 0.380360 0.132790 2.864364 0.0044

R-squared 0.086962     Mean dependent var 0.040299


Adjusted R-squared 0.080062     S.D. dependent var 0.084834
S.E. of regression 0.081368     Akaike info criterion -2.169755
Sum squared resid 2.628410     Schwarz criterion -2.129915
Log likelihood 439.0359     Hannan-Quinn criter. -2.153980
F-statistic 12.60397     Durbin-Watson stat 1.736991
Prob(F-statistic) 0.000000

log(psoda) = -1,463332+0,072807prpblck + 0.136955log(Income)+ 0,380360 prppov

Setelah ditambahkan variabel pprpov (proporsi penduduk miskin) ke dalam model maka, diperoleh
nilai koefisien prpblck lebih kecil ( koefisien prpblck turun menjadi 0.072807) dibanding sebelum
ditambah variabel pprpov (koefisien prpblck 0.1216). Jadi semakin bertambahnya proporsi orang
miskin maka akan menaikkan harga soda.
(vi) Find the cor

Hasil output dari korelasi antara variabel Log(Income) dg prppov


LOG(INCOME) PRPPOV
LOG(INCOME)  1.000000 -0.838467
PRPPOV -0.838467  1.000000

Nilai korelasi antara variabel log(income) dengan prppov sebesar -0.838467 yaitu kuat dan
berlawanan arah., sesuai dengan teori bahwa tingkat kemiskinan ditentukan oleh tingkat
pendapatan, yaitu semakin tinggi tingkat kemiskinan maka semakin rendah tingkat pendapatan.
(vii) Evaluate the
they have no business being in the same regression.”

Nilai korelasi yang tinggi (-0.838) antara variabel log(income) dengan prppov patut dicurigai adanya
multikoliniearitas. Untuk meyakinkan apakah terjadi multikolinearitas pada dua variabel tersebut,
maka dilakukan penghitungan nilai centered VIF, jika nilai centered VIF diatas 10 maka terjadi
multikolinearitas. Ternyata nilai Centered VIF sebesar 3.400755, sehingga anatar keuda variabel
tersebut tidak terjadi multikolinearitas.

Variance Inflation Factors


Date: 11/18/19 Time: 21:53
Sample: 1 410
Included observations: 401

Coefficient Uncentered Centered


Variable Variance VIF VIF

C  0.092508  5046.545  NA


LOG(INCOME)  0.000768  4817.654  3.400755
PRPPOV  0.013545  7.207431  3.400755

Jadi tidak ada argument yang kuat yang mengatakan bahwa kedua variabel tersebut berkorelasi
kuat, tetapi kedua variabel tersebut digunakan hanya sebagai control untuk menentukan apakah ada
diskriminasi harga soda terhadap orang kulit hitam yang dikarenakan oleh variabel bebas
pendapatan dan proporsi orang miskin.

C10.
Use the data in ELEM94_95 to answer this question. The findings can be compared with those in
Table 4.1. The dependent variable lavgsal is the log of average teacher salary and bs is the ratio of
average benefits to average salary (by school).

(i) Run the simple regression of lavgsal on bs. Is the estimated slope statistically different fromzero?
Is it statistically different from -1?

Dependent Variable: LAVGSAL


Method: Least Squares
Date: 12/02/19 Time: 11:14
Sample: 1 1848
Included observations: 1848

Variable Coefficient Std. Error t-Statistic Prob.  

C 10.74790 0.051662 208.0417 0.0000


BS -0.795124 0.149654 -5.313068 0.0000

R-squared 0.015061     Mean dependent var 10.47490


Adjusted R-squared 0.014528     S.D. dependent var 0.232895
S.E. of regression 0.231197     Akaike info criterion -0.090011
Sum squared resid 98.67252     Schwarz criterion -0.084035
Log likelihood 85.17033     Hannan-Quinn criter. -0.087808
F-statistic 28.22869     Durbin-Watson stat 0.931982
Prob(F-statistic) 0.000000

H0: b2=0
H1: b2≠0
Nilai p-value pada b2 kecil dari α maka keputusan tolak H0, Variabel BS signifikan mempengaruhi
lavgsal. Selang kepercayaan yang di hasilkan adalah
Ketika
H0: b2=-1
H1: b2≠-1

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

t-statistic  1.368990  1846  0.1712


F-statistic  1.874134 (1, 1846)  0.1712
Chi-square  1.874134  1  0.1710

Null Hypothesis: C(2)=-1


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

1 + C(2)  0.204876  0.149654

Restrictions are linear in coefficients.

ketika b2=-1 maka keputusan tidak tolak H0 dilihat dari niai F test mauun chi sqy=uare dimana p-
value>α

(ii) Add the variables lenrol and lstaff to the regression from part (i). What happens to the coefficient
on bs? How does the situation compare with that in Table 4.1?

Dependent Variable: LAVGSAL


Method: Least Squares
Date: 12/02/19 Time: 11:19
Sample: 1 1848
Included observations: 1848

Variable Coefficient Std. Error t-Statistic Prob.  

C 13.95305 0.107234 130.1182 0.0000


BS -0.605061 0.108743 -5.564138 0.0000
LENROL -0.031585 0.008477 -3.726038 0.0002
LSTAFF -0.713720 0.017790 -40.11874 0.0000

R-squared 0.482035     Mean dependent var 10.47490


Adjusted R-squared 0.481192     S.D. dependent var 0.232895
S.E. of regression 0.167750     Akaike info criterion -0.730517
Sum squared resid 51.89050     Schwarz criterion -0.718565
Log likelihood 678.9981     Hannan-Quinn criter. -0.726111
F-statistic 572.0277     Durbin-Watson stat 0.894224
Prob(F-statistic) 0.000000

Ketika lenrol dan lstaff ditambahkan ke regresi pert (ii), koefisien pada bs menjadi lebih kecil nilainya
dibandingkan regresi part (i), yaitu −0.605 karena ketika lstaff dan lenroll ditambah maka averae
salary akan berkurang , semain bertambah staff dan penambahan beban yang yang akan di gaji
menjadi lebih banyak pula, sehingga rata-rata gaji menjadi berkurang. Adapun Nilai bs hampir sama
dengan yang ada pada Tabel 4.1,, di mana estimasi regresi −0.605.

(iii) How come the standard error on the bs coefficient is smaller in part (ii) than in part (i)? (Hint:
What happens to the error variance versus multicollinearity when lenrol and lstaff are added?)

Kesalahan standar estimasi regresi sederhana adalah sekitar 0,150 (regresi pertama pada BS), dan
untuk estimasi regresi berganda adalah sekitar 0,109 (regresi kedua pada BS). Ketika kami
menambahkan variabel penjelas tambahan, dua faktor bekerja berlawanan arah pada kesalahan
standar. Multikolinearitas - dalam hal ini, korelasi antara bs dan dua variabel lenrol dan lstaff bekerja
untuk meningkatkan kesalahan standar regresi berganda. Bekerja untuk mengurangi kesalahan
standar ^β bsadalah varians kesalahan yang lebih kecil ketika lenrol dan lstaff dimasukkan dalam
regresi; pada dasarnya, mereka dikeluarkan dari istilah kesalahan regresi sederhana. Dalam contoh
khusus ini, multikolinearitas lebih sederhana dibandingkan dengan pengurangan varians kesalahan.
Faktanya, kesalahan standar dari regresi berubah dari 0,231 untuk regresi sederhana menjadi 0,168
dalam regresi berganda. (Cara lain untuk meringkas penurunan varians kesalahan adalah dengan
mencatat bahwa R-kuadrat berubah dari 0,0151 yang sangat kecil untuk regresi sederhana menjadi
0,4882 untuk regresi berganda.) Tentu saja, sebelumnya kita tidak dapat mengetahui efek mana
yang akan mendominasi, tetapi kita tentu saja dapat membandingkan kesalahan standar setelah
menjalankan kedua regresi

(iv) How come the coefficient on lstaff is negative? Is it large in magnitude?

Variabel lstaff adalah catatan jumlah staf per 1.000 siswa. Ketika lstaff meningkat, ada lebih banyak
guru per siswa. Kami dapat mengaitkan ini dengan ukuran kelas yang lebih kecil, yang umumnya
diinginkan dari perspektif guru. Tampaknya, semuanya sama, guru bersedia menerima gaji lebih
sedikit untuk memiliki ukuran kelas yang lebih kecil. Elastisitas gaji sehubungan dengan staf adalah
sekitar 14.714, yang tampaknya cukup besar: peningkatan sepuluh persen dalam ukuran staf
(mempertahankan pendaftaran tetap) dikaitkan dengan gaji yang lebih rendah 7,14 persen.
(v) Now add the variable lunch to the regression. Holding other factors fixed, are teachers being
compensated for teaching students from disadvantaged backgrounds? Explain.

Dependent Variable: LAVGSAL


Method: Least Squares
Date: 12/06/19 Time: 20:13
Sample: 1 1848
Included observations: 1848

Variable Coefficient Std. Error t-Statistic Prob.  

C 13.83149 0.109726 126.0550 0.0000


BS -0.516129 0.109775 -4.701709 0.0000
LSTAFF -0.690632 0.018360 -37.61528 0.0000
LENROL -0.028409 0.008456 -3.359616 0.0008
LUNCH -0.000758 0.000161 -4.694620 0.0000

R-squared 0.488155    Mean dependent var 10.47490


Adjusted R-squared 0.487045    S.D. dependent var 0.232895
S.E. of regression 0.166801    Akaike info criterion -0.741323
Sum squared resid 51.27730    Schwarz criterion -0.726383
Log likelihood 689.9822    Hannan-Quinn criter. -0.735815
F-statistic 439.4257    Durbin-Watson stat 0.921183
Prob(F-statistic) 0.000000

Ketika makan siang ditambahkan ke regresi, koefisiennya adalah sekitar −,00076, dengan t = −4,69.
Oleh karena itu, faktor-faktor lain tetap (bs, lenrol, dan lstaff), tingkat kemiskinan yang disewa
dikaitkan dengan gaji guru yang lebih rendah. Dalam kumpulan data ini, nilai rata-rata makan siang
adalah sekitar 36,3 dengan standar deviasi 25,4. Oleh karena itu, peningkatan satu standar deviasi
dalam makan siang dikaitkan dengan perubahan dalam lsalary sekitar −,00076 (25,4) ≈ −,019, atau
hampir dua persen lebih rendah. Tentu saja tidak ada bukti bahwa guru diberi kompensasi untuk
mengajar anak-anak yang kurang beruntung.

(vi) Overall, is the pattern of results that you find with ELEM94_95 consistent with the pattern in
Table 4.1?
Ya, pola yang diperoleh dengan menggunakan ELEM94_95.RAW sangat mirip dengan pada Tabel 4.1,
dan besarnya cukup dekat juga. Estimasi terbesar (dalam nilai absolut) adalah estimasi regresi
sederhana, dan nilai absolut menurun karena lebih banyak variabel penjelas ditambahkan. Regresi
akhir dalam dua kasus tidak sama, karena kami tidak mengontrol makan siang di Tabel 4.1, dan
tingkat kelulusan dan putus sekolah tidak relevan untuk anak-anak sekolah dasar

C11.

(I) educ= b0 + b1 motherdus + b2 faherduc +b3abil + b4 abil 2 + u

Dari hasil diatas diperoleh model:


educ= 8,24 + 0,19 motherduc +0,11 faherduc +0,40 abil + 0,05 abil 2 + u
variabel abil signifikan memengaruhi education. Ketika kemauan meningkat 1 satuan maka
pendidikannya akan naik sebesar 0,401 tahun. Variabel educ 2 yang signifikan menunjukkan tidak
adanya the law of diminishing namun INCREASING. Semakin tinggi ability maka edukasi semakin
tinggi juga.
(II)
Ho: b1=b2
Hi: b1≠b2
Hasil untuk restriksi koefisien wald test

Hasil dari wald-test adalah variabel mother education dan father education sama-sama tidak
memengaruhi education seseorang pada level 5% namun signifikan pada level 10%.

(III)
Hasil penambahan variabel independen tuit 17 dan tuit18
Dependent Variable: EDUC
Method: Least Squares
Date: 12/08/19 Time: 06:02
Sample: 1 1230
Included observations: 1230

Variable Coefficient Std. Error t-Statistic Prob.  

C 8.081339 0.312614 25.85082 0.0000


MOTHEDUC 0.192863 0.028168 6.846867 0.0000
FATHEDUC 0.108368 0.019601 5.528692 0.0000
ABIL 0.399081 0.030336 13.15556 0.0000
ABIL*ABIL 0.050599 0.008302 6.095045 0.0000
TUIT17+TUIT18 0.007981 0.006187 1.290101 0.1973

R-squared 0.445105    Mean dependent var 13.03740


Adjusted R-squared 0.442838    S.D. dependent var 2.354346
S.E. of regression 1.757361    Akaike info criterion 3.970370
Sum squared resid 3780.103    Schwarz criterion 3.995320
Log likelihood -2435.778    Hannan-Quinn criter. 3.979757
F-statistic 196.3642    Durbin-Watson stat 1.824287
Prob(F-statistic) 0.000000

Dari hasil regresi diketahui hasil penambahan variabel tuit17 dan tuit18 baik secara terpisah
maupun digabung tidak signifikan mempengaruhi education.

(IV)

corelasi anatar tuit 17 dan tuit 18 cukup kuat dan positif.

Dependent Variable: EDUC


Method: Least Squares
Date: 12/08/19 Time: 06:09
Sample: 1 1230
Included observations: 1230

Variable Coefficient Std. Error t-Statistic Prob.  

MOTHEDUC 0.520449 0.029730 17.50592 0.0000


FATHEDUC 0.170232 0.022982 7.407228 0.0000
EXPER 1.013956 0.062437 16.23965 0.0000
EXPERSQ -0.057161 0.003339 -17.11738 0.0000
(TUIT17+TUIT18)/2 0.084275 0.014372 5.863757 0.0000

R-squared 0.218062    Mean dependent var 13.03740


Adjusted R-squared 0.215508    S.D. dependent var 2.354346
S.E. of regression 2.085281    Akaike info criterion 4.311741
Sum squared resid 5326.784    Schwarz criterion 4.332532
Log likelihood -2646.720    Hannan-Quinn criter. 4.319563
Durbin-Watson stat 1.719790

hetika variabel tuit17 dan tuit 18 yang dipakai dalam regresi adalah rata-ratanya maka dapat
menunjukkan rata-rata biaya kuliah signifikan mempengaruhi education. Rata-rata digunakan karena
biaya kuliah tahun x dan x-1 dapat digambarkan melalui rata-rata untuk melihat biaya kuliah selama
periode tertentu.
(V) Temuan untuk variabel kuliah rata-rata di bagian (iv) masuk akal ketika diartikan secara kausal
dan mungkin terjadi karena rata-rata menggambarkan populasi. Ketika biaya kuliah per tahun saja
yang di analisis nilai ini dapat menimbukan unconsiten karena biaya kuliah antar tahun pasti
memiliki hubungan korekasi yang tinggi sehingga jika mengunakan rata-rata masalah multikol dapat
teratasi.

Anda mungkin juga menyukai