Anda di halaman 1dari 10

Diponegoro University - Dept.

of Economics Econometrics 1

Model Level-Level dan Model Level-Log


Contoh 4.2: Kinerja Siswa dan Ukuran Sekolah
Sumber: Wooldridge, J.M. (2005). Introductory Econometrics: A Modern Approach. 5th
ed. South-Western Ch. 4, p.127-128
Diterjemahkan secara bebas oleh Alfa Farah dan Febby Tiur Nur Carolina
Last updated: March 16, 2023

Ketertarikan terhadap isu pengaruh ukuran sekolah terhadap kinerja siswa sangatlah tinggi.
(Lihat misalnya The New York Times Magazine, 28/5/95.). Ada sebuah klaim yang meny-
atakan bahwa siswa di sekolah yang jumlah muridnya sedikit (sekolah yang ukurannya lebih
kecil) menunjukkan hasil yang lebih baik dibandingkan dengan siswa di sekolah yang jumlah
siswanya lebih banyak (sekolah yang ukurannya lebih besar), dengan mengasumsikan hal-
hal lain dianggap setara. Hipotesis ini dianggap benar bahkan setelah memperhitungkan
perbedaan ukuran kelas di seluruh sekolah.
File MEAP93 berisi data 408 SMA di Negara Bagian Michigan tahun 1993. Kita dapat
menggunakan data tersebut untuk menguji hipotesis nol yang menyatakan bahwa ukuran
sekolah tidak berpengaruh terhadap nilai tes standar terhadap hipotesis alternatif yang
menyatakan bahwa ukuran sekolah berpengaruh negatif. Kinerja diukur dengan persentase
siswa yang lulus kelulusan pada tes matematika standar kelas sepuluh ujian matematika
MEAP Michigan Educational Assessment Program (MEAP) kelas sepuluh (math10). Uku-
ran sekolah diukur dengan jumlah siswa yang terdaftar di sekolah (enroll ). Hipotesis nolnya
adalah H0 : βenroll = 0, dan hipotesis alternatifnya adalah H1 : βenroll < 0. Untuk saat ini,
kita mengontrol dua faktor lainnya, yaitu: rata-rata kompensasi guru per tahun (totcomp)
dan jumlah staf per seribu siswa (staff ). Kompensasi guru adalah ukuran kualitas guru, dan
ukuran staf adalah ukuran kasar seberapa banyak perhatian yang diterima siswa. Persamaan
hasil estimasi dengan eror standar dalam tanda kurung adalah sebagai berikut
V

math10 = 2, 274 + 0, 00046totcomp + 0, 048staff − 0, 00020enroll


(6, 113) (0, 00010) (0, 040) (0, 00022)
n = 408, R2 = 0, 0541.

Koefisien variabel enroll -0,00020 sesuai dengan dugaan bahwa sekolah yang lebih besar
menghambat kinerja siswa: semakin banyak jumlah siswa yang terdaftar di suatu sekolah
semakin rendah persentase siswa yang lulus ujian matetikan MEAP kelas sepuluh. (Koefisien
variabel totcomp dan staff juga memiliki tanda yang kita harapkan.) Fakta bahwa variabel

Dr.rer.pol Alfa Farah 1 of 3


Diponegoro University - Dept. of Economics Econometrics 1

enroll memiliki estimasi koefisien yang berbeda dari nol bisa saja karena disebabkan oleh
kesalahan pengambilan sampel (sampling error, yaitu kesalahan yang muncul karena sampel
tidak mencerminka populasi. Untuk memastikan bahwa pengaruh itu memang ada, kita
perlu melakukan uji t.
Karena n − k − 1 = 408 − 4 = 404, kita menggunakan normal critical value (nilai kritis
pada distribusi normal). Pada taraf 5%, nilai kritisnya adalah −1, 65; t statistik pada enroll
harus kurang dari −1, 65 untuk menolak H0 pada tingkat 5%.
t statistik enroll adalah −0, 00020/0, 00022 ≈ −0, 91, yang lebih besar dari −1, 65. Ini
berarti kita gagal menolak H0 dan, dengan demikian, kita menolak H1 pada tingkat 5%.
Faktanya, nilai kritis 15% adalah −1, 04, dan karena −0, 91 > −1.04, kita bahkan gagal
menolak H0 bahkan pada level 15%. Kita menyimpulkan bahwa enroll tidak signifikan
secara statistik pada tingkat 15%. [Catatan: Karena enroll tidak signifikan secara statistik,
ini berarti ukuran sekolah tidak berpengaruh terhadap kinerja siswa]
Variabel totcomp secara statistik signifikan bahkan pada tingkat signifikansi 1% karena t
statistiknya adalah 4, 6. [Catatan: Karena totcomp secara statistik signifikan, maka kompe-
nasasi guru berpengaruh singnifikan terhadap kinerja siswa. Kita dapat menginterpretasikan
parameter totcomp sebagai berikut: ketika rata-rata kompensasi guru per tahun meningkat
sebesar satu dolar, maka persentase siswa yang lulus ujian MEAP bidang matematika ke-
las sepuluh meningkat sebesar 0,00046 poin persentasi, dengan asumsi semua faktor lain
dianggap tetap.]
Sebaliknya, t statistik untuk staff adalah 1, 2 sehingga kita tidak dapat menolak H0 : βstaf f =
0 terhadap hipotesis alternatif H1 : βstaf f > 0 bahkan pada tingkat signifikansi 10%. (Nilai
kritis pada adalah 10% adalah dalam distribusi normal adalah 1,28.) [Catatan: ini berarti
jumlah staff tidak berpengaruh terhadap kinerja siswa]
Untuk mengilustrasikan bagaimana perubahan bentuk fungsional dapat memengaruhi kes-
impulan kita, kita juga mengestimasi model dengan semua variabel penejelas dalam ben-
tuk logaritma. Hal ini memungkinakan kita untuk mengenalisis, misalnya, berkurangnya
pengaruh ukuran sekolah seiring dengan bertambahnya ukuran sekolah. Persamaan yang
diperkirakan adalah
V

math10 = −207, 66 + 21, 16log(totcomp) + 3, 98log(staff) − 1, 29log(enroll)


(48, 70) (4, 06) (4, 19) (0, 69)
n = 408, R2 = 0, 0654.

t statistik pada log(enroll ) adalah sekitar −1, 87. Karena t statistik lebih kecil dari nilai

Dr.rer.pol Alfa Farah 2 of 3


Diponegoro University - Dept. of Economics Econometrics 1

kritis pada tingkat 5% (−1, 65), kita menolak H0 : βlog(enroll) = 0 dan, dengan demikian,
tidak menolak H1 : βlog(enroll) < 0 pada tingkat 5%.
Pada Bab 2 kita akan menjumpai model dengan variabel dependen dalam bentuk aslinya
(bentuk level, tidak ditransformasi apapun), sedangkan variabel independen muncul dalam
bentuk log (disebut model level-log). Interpretasi parameter adalah sama dalam konteks
regresi berganda, kecuali, tentu saja, kita dapat memberikan parameter interpretasi ce-
V

teris paribus. Dengan mengontrol totcomp dan staff tetap, kita memiliki ∆math10 =
−1, 29[∆log(enroll)], sehingga
V

∆math10 = (−1, 29/100)(%∆enroll) ≈ −0, 013(%∆enroll).


Sekali lagi, kita telah menggunakan fakta bahwa perubahan log(enroll ) bila dikalikan dengan
100 diperkirakan sama dengan persentase perubahan enroll. Jadi, jika jumlah siswa yang
V

terdaftar 10% lebih tinggi di sekolah, math10 diprediksi menjadi 0, 013(10) = 0, 13 poin
persentase lebih rendah (math10 diukur dalam persentase).
Model mana yang kita pilih: yang menggunakan enroll yang tidak ditransformasi (level)
atau yang menggunakan log(enroll )? Dalam model level-level, pendaftaran tidak memiliki
pengaruh yang signifikan secara statistik, tetapi dalam model level-log berpengaruh. Ini
mengarah pada nilai R-square yang lebih tinggi untuk model level-log, yang berarti kita
dapat menjelaskan lebih banyak variasi dalam math10 dengan menggunakan model dengan
enroll dalam bentuk logaritmik (6,5% hingga 5,4%). Model level-log lebih disukai karena
model ini bisa lebih menangkap hubungan antara math10 dan enroll. Kita akan membahas
lebih banyak tentang penggunaan R-squared untuk memilih bentuk fungsional di Bab 6.

Dr.rer.pol Alfa Farah 3 of 3


Diponegoro University - Dept. of Economics Econometrics 1

Koefisien Beta
Contoh 6.1: Pengaruh Polusi terhadap Harga Rumah

Sumber: Wooldridge, J.M. (2005). Introductory Econometrics: A Modern Approach. 5th


ed. South-Western Ch. 6, p.190-191

Diterjemahkan secara bebas oleh Alfa Farah dan Deva Zhalzha Amalia
Last updated: March 16, 2023

Kita menggunakan data dari Contoh 4.5 (dalam file HPRICE.RAW) untuk mengilustrasikan
penggunaan koefisien beta. Ingatlah kembali bahwa variabel independen utama adalah nox,
yaitu ukuran nitrogen oksida di udara di setiap wilayah. Salah satu cara untuk mema-
hami besarnya efek polusi –tanpa perlu mendalami lebih jauh mendalami pengaruh nitrogen
oksida terhadap kualitas udara-– adalah dengan menghitung beta koefisien (Pendekatan lain-
nya selain menghitung koefisien beta terdapat dalam Contoh 4.5, yaitu dengan menghitung
elastisitas harga terhadap nox dengan menggunakan variabel price dan nox dalam bentuk
logaritma)

Persamaan populasi dalam bentuk level-level ditulis sebagai berikut:

price = β0 + β1 nox + β2 crime + β3 rooms + β4 dist + β5 stratio + u,

ddengan semua variabel kecuali crime didefinisikan seperti dalam Contoh 4.5. [Catatan:
dalam Contoh 4.5, price adalah harga rumah median di sebuah komunitas, nox adalah
jumlah nitrogen oksida di udara yang diukur dalam bagian per juta, dist adalah jarak ko-
munitas terhadap lima pusat layanan penyedia kerja (jarak tersebut adalah jarak terbobot),
rooms adalah jumlah kamar rata-rata di sebuah komunitas dan stratio adalah rasio rata-rata
murid terhadap guru di sebuah komunitas]. Variabel crime diukur dengan jumlah kejahatan
perkapita yang dilaporkan. Koefisien beta dilaporkan dalam persamaan berikut (sehingga
setiap variabel telah dikonversi menjadi z − score):

d = −, 340nox − 1, 43crime+, 514rooms−, 235dist−, 270stratio


zprice

[Catatan: asumsikan bahwa semua variabel sinifikan secara statistik] Persamaan ini menun-
jukkan bahwa peningkatan satu standar deviasi pada nox menurunkan harga sebesar 0,340
standar deviasi, peningkatan satu standar deviasai pada crime mengurangi harga sebesar
0,14 standar deviasi. Dengan demikian, polusi memiliki pengaruh yang lebih besar terhadap

Dr.rer.pol Alfa Farah 1 of 2


Diponegoro University - Dept. of Economics Econometrics 1

harga rumah dibandingkan kejahatan. Ukuran rumah, yang diukur dengan jumlah kamar
memiliki pengaruh terbesar. Jika kita ingin mengetahui pengaruh dari masing-masing vari-
abel independen terhadap nilai dolar dari harga rata-rata rumah, kita harus menggunakan
variabel yang tidak terstandarisasi.

Menggunakan variabel yang terstandarisasi atau tidak menggunakan terstandarisasi tidak


mempengaruhi signifikansi statistiknya. Nilai t statistik adalah sama dalam kedua ka-
sus.

Dr.rer.pol Alfa Farah 2 of 2


Diponegoro University - Dept. of Economics Econometrics 1

Model Kuadratik
Contoh 6.2: Pengaruh Polusi terhadap Harga Rumah

Sumber: Wooldridge, J.M. (2005). Introductory Econometrics: A Modern Approach. 5th


ed. South-Western Ch. 6, p.196-197

Diterjemahkan secara bebas oleh Alfa Farah dan Muhammad Muhadi Ashari
Last updated: March 16, 2023

Kita memodifikasi model untuk mengestimasi harga rumah dalam Contoh 4.5 dengan mema-
sukkan unsur kuadratik dari variabel rooms:

price = β0 + β1 log nox + β2 log dist + β3 rooms + β4 rooms2 + β5 stratio + u,

Model yang telah diestimasi menggunakan set data HPRICE2.RAW adalah

logprice
d = 13,39 - ,0902 log nox - ,087 log(dist)
(,57) (,115) (,043)
-,545 rooms + ,062 rooms2 - ,048 stratio
(,165) (,013) (,006)
2
n=506, R =, 603

Variabel kuadratik rooms2 memiliki nilai t statistik sekitar 4,77 dan, dengan demikian, vari-
abel tersebut sangat signifikan secara statistik. Namun, bagaimana cara menginterpretasikan
pengaruh variabel rooms terhadap log(price)? Pengaruh variabel rooms terlihat aneh karena
koefisien variabel rooms negatif sedangkan koefisien variabel rooms2 positif. Persamaan ini
secara harfiah menyiratkan bahwa pada nilai variabel rooms yang rendah, penambahan satu
kamar memiliki pengaruh negatif terhadap log(price). Pada suatu titik tertentu, pengaruh
ini menjadi positif. Bentuk kuadratik tersebut menunjukkan bahwa semi-elastisitas price ter-
hadap rooms meningkat ketika nilai rooms meningkat Situasi ini ditunjukkan dalam Gambar
6.2.

Kami dapat menghitung nilai titik balik pada variabel rooms dengan menggunakan rumus
dalam Persamaan (6.13) (meskipun β1 negatif dan β2 positif). Dalam rumus tersebut nilai
absolut dari koefisien rooms, .545, dibagi dengan dua kali nilai koefisien variabel rooms2 ,
,062, yaitu rooms∗ =, 545/(2(, 062)) ≈ 4, 4. Titik ini ditunjukkan dalam Gambar 6.2.

Apakah kita benar-benar percaya bahwa meningkatkan jumlah kamar dari tiga menjadi em-
pat justru mengurangi nilai ekspektasi sebuah rumah? Kemungkinan besar tidak. Ternyata,

Dr.rer.pol Alfa Farah 1 of 3


Diponegoro University - Dept. of Economics Econometrics 1

hanya ada lima dari 506 komunitas dalam sampel yang memiliki rata-rata jumlah kamar ku-
rang dari atau sama dengan 4,4 kamar, yaitu sekitar 1% dari sampel. Persentase ini sangat
kecil sehingga efek kuadratik di sisi kiri nilai 4,4 dapat diabaikan. Di sisi kanan nilai 4,4,
kita melihat bahwa penambahan satu kamar memiliki pengaruh yang meningkat terhadap
persentase perubahan harga rumah:

∆ log(price)
d ≈ [−, 545 + 2(, 062)]rooms∆rooms

sehingga

%∆ log(price)
d ≈ 100[−, 545 + 2(, 062)]rooms∆rooms
= (−, 54.5 + 12, 4rooms)∆rooms

Dengan demikian, penambahan rooms dari lima menjadi enam meningkatkan harga rumah
sekitar -54.5 + 12.4(5) = 7,5% sedangkan penambahan dari enam menjadi tujuh meningkatkan
harga rumah sekitar -54.5 + 12.4(6) = 19.9%. Ini menunjukkan efek peningkatan yang sangat
kuat.

Efek peningkatan yang kuat dari rooms terhadap log(price) dalam contoh ini menunjukkan
sebuah pelajaran penting: kita tidak dapat hanya melihat koefisien variabel kuadratik –

Dr.rer.pol Alfa Farah 2 of 3


Diponegoro University - Dept. of Economics Econometrics 1

dalam hal ini, 0,062– dan menyatakan bahwa nilainya terlalu kecil untuk diperhitungkan
hanya karena nilai besarannya yang kecil (magnitude-nya kecil) . Dalam banyak aplikasi
model kuadratik, koefisien variabel yang dikuadratkan sering kali memiliki satu atau lebih
angka nol setelah koma [Catatan: ini berarti magnitude-nya sangat kecil]. Hal ini tidak ter-
lalu bermasalah karena koefisien variabel kuadrat mengukur bagaimana kemiringan (slope)
berubah ketika variabel penjelas (rooms) berubah. Koefisien yang tampaknya kecil dapat
memiliki konsekuensi yang penting secara praktis, seperti yang baru saja kita diskusikan.
Secara umum, kita harus menghitung efek parsial dan melihat bagaimana efek tersebut
bervariasi dengan x untuk menentukan apakah variabel kuadratik tersebut penting secara
praktis.

Ketika melakukan hal ini, ada baiknya kita membandingkan kemiringan (slope) yang tidak
tetap yang dihasilkan dari model dengan kuadratik dengan kemiringan yang dihasilkan oleh
model linear yang bersifat tetap. Jika kita menghapus rooms2 dari persamaan [Catatan:
berarti model linear], koefisien rooms menjadi sekitar 0,255, yang berarti bahwa setiap
penambahan satu kamar (berapapun jumlah kamar mula-mula) meningkatkan harga median
rumah sebesar sekitar 25.5%. Interpretasi ini sangat berbeda dari model kuadratik, di mana
efek tersebut mencapai 25.5% pada rooms = 6.45, tetapi berubah dengan cepat ketika rooms
menjadi semakin kecil atau semakin besar. Sebagai contoh, pada nilai rooms = 7, pengaruh
penambahan satu kamar terhadap harga median rumah adalah sekitar 32.3%.

Dr.rer.pol Alfa Farah 3 of 3


Diponegoro University - Dept. of Economics Econometrics 1

Model dengan interaksi antarvariabel


Contoh 6.3: Pengaruh Kehadiran terhadap Kinerja Ujian Akhir

Sumber: Wooldridge, J.M. (2005). Introductory Econometrics: A Modern Approach. 5th


ed. South-Western Ch. 6, p.198-199

Diterjemahkan secara bebas oleh Alfa Farah dan Muhammad Fariq Danendra
Last updated: March 16, 2023

Sebuah model yang menjelaskan nilai ujian akhir yang distandardisasi (stndfnl ) dengan
persentase kehadiran di kelas, rata-rata nilai IPK sebelumnya, dan skor ACT ditulis sebagai
berikut:

stndf nl =β0 + β1 atndrte + β2 priGP A + β3 ACT + β4 priGP A2 +


β5 ACT 2 + β6 priGP A · atndre + u

(Kita menggunakan nilai ujian yang telah distandardisasi dengan alasan yang telah dibahas
di Bagian 6.1, yaitu: lebih mudah untuk menafsirkan kinerja siswa secara relatif terhadap
siswa lainnya di kelas). Selain mengikutsertakan bentuk kuadrat priGP A dan ACT , model
ini juga memasukkan interaksi antara priGP dan tingkat kehadiran. Alasannya adalah
bahwa kehadiran di kelas mungkin memiliki pengaruh yang berbeda bagi siswa yang memiliki
kinerja masa lalu yang berbeda, yang diukur dengan priGP A. Kita tertarik untuk melihat
pengaruh kehadiran terhadap nilai ujian akhir: ∆stndf nl/∆atndrte = β1 + β6 priGP A

Dengan menggunakan data dari 680 mahasiswa yang mengikuti kuliah Pengantar Teori
Mikroekonomi yang tercakup dalam set data ATTEND.RAW, persamaan perkiraan yang
diperoleh adalah
stndf nl = 2, 05 − , 0067atndrte − 1, 63priGP A − , 128ACT
(1, 36) (, 0102) (, 48) (, 098)
+ , 296priGP A2 + , 0045ACT 2 + , 0056priGP A · atndre
(, 101) (, 0022) (, 0043)

n = 680, R2 =, 229, R̄2 =, 222


Kita harus menafsirkan persamaan ini dengan sangat hati-hati. Jika kita hanya melihat
koefisien atndrte, kita akan salah menyimpulkan bahwa kehadiran memiliki pengaruh negatif
pada nilai ujian akhir. Koefisien atndrte ini hanya mengukur pengaruh tingkat kehadiran
ketika priGP A = 0 (Dalam penelitian ini, nilai priGP A = 0 tidak menarik karena dalam

Dr.rer.pol Alfa Farah 1 of 2


Diponegoro University - Dept. of Economics Econometrics 1

sampel nilai priGP A terendah adalah ,86). Kita juga harus berhati-hati untuk tidak melihat
secara terpisah nilai perkiraan β1 dan β6 dan menyimpulkan bahwa kita tidak dapat menolak
H0 : β1 = 0 dan H0 : β6 = 0 karena t statistik keduanya tidak signifikan. Faktanya, nilai p
untuk uji F adalah ,014, sehingga kita tentu menolak H0 pada tingkat alpha 0,05. Ini adalah
contoh yang sangat bagus untuk menunjukkan bahwa melihat t statistik secara terpisah
ketika menguji hipotesis simultan dapat menyesatkan.

Bagaimana kita harus memperkirakan efek parsial atndrte pada stndf nl? Kita harus mema-
sukkan nilai-nilai priGP A yang menarik untuk mendapatkan efek parsial (misalnya dengan
memasukkan nilai rata-rata) Nilai rata-rata priGP A dalam sampel adalah 2,59, jadi pada
priGP A rata-rata, pengaruh atndrte pada stndf nl sebesar -,0067 + ,0056(2,59) = ,0078.
Apa artinya ini? Karena atndrte diukur dalam persentase, ini berarti bahwa peningkatan
10 poin persentase dalam atndrte meningkatkan stndf nl sebesar ,078 standar deviasi dari
nilai ujian akhir rata-rata.

Bagaimana kita bisa tahu apakah perkiraan ,0078 secara statistik berbeda dari nol? Kita
perlu menjalankan kembali regresi, di mana kita mengganti priGP A·atndrte dengan (priGP A−
2, 59) · atndrte. Hasil estimasi akan memunculkan koefisien baru atndrte menginformasikan
pengaruh atndrte pada priGP A ketika priGP A = 2, 59 beserta eror standarnya. Hal-
hal lainnya tidak berubah (Ini dijelaskan di Bagian 4.4.). Dengan melakukan regresi baru
ini, eror standar β1 + β6 (2, 59) =, 0078 adalah sebesar ,0026, yang menghasilkan nilai t =
, 0078/, 0026 = 3. Oleh karena itu, pada priGP A rata-rata, kita menyimpulkan bahwa
kehadiran memiliki pengaruh positif yang signifikan secara statistik terhadap nilai ujian
akhir.

Menemukan pengaruh priGP A terhadap stndf nl sangat rumit karena adanya kuadrat,
priGP A2 . Untuk menemukan pengaruh priGP A pada nilai rata-ratanya (2,59) dan atndrte
pada nilai rata-ratanya (82), kita mengganti priGP A2 dengan (priGP A−2, 59)2 dan priGP A·
atndrte dengan priGP A · (atndrte − 82). Koefisien pada priGP A menjadi efek parsial pada
nilai rata-rata, dan kita juga akan memeroleh eror standarnya.

Dr.rer.pol Alfa Farah 2 of 2

Anda mungkin juga menyukai