METODOLOGI
3.1 PENGENALAN
Bab ini membincangkan dan menghuraikan mengenai proses atau kaedah yang digunakan
bagi pembentukan model yang dianggar bagi kajian yang dijalankan oleh pengkaji.
Metodologi bermaksud sistem yang merangkumi kaedah dan prinsip yang digunakan dalam
sesuatu kegiatan, disiplin dan sebagainya (Kamus Dewan: 1994). Oleh itu, sebelum
pembentukan model peramalan dijelaskan secara terperinci, penyelidik perlu membincangkan
model regresi terlebih dahulu. Ini adalah kerana, setiap bidang penyelidikan akan mempunyai
kaedah atau metodologinya yang tersendiri untuk menerangkan hasil penyelidikan yang
diperolehi. Merujuk kepada kajian yang dijalankan ini, pengkaji meramalkan perbelanjaan
awam Malaysia dari tahun 1981 hingga 2014 dengan mengambilkira faktor-faktor yang
mempengaruhinya iaitu cukai pendapatan petroleum, royalty petroleum dan gas serta
keluaran dalam negara kasar sebagai pembolehubah bagi kajian ini. Faktor-faktor ini akan
diambilkira ketika membentuk model regresi bagi kadar inflasi.
iii) Bentuk model dan juga bentuk hubungan model tersebut (persamaan serentak atau
persamaan linear atau sebaliknya).
Data-data yang digunakan oleh pengkaji dalam pembentukan model adalah terdiri daripada
data-data yang menerangkan nilai-nilai pembolehubah dari satu masa ke satu masa iaitu data
belanja awam, hasil cukai pendapatan petroleum, royalty petroleum dan gas serta keluaran
dalam Negara kasar.
matematik, diharapkan akan menghasilkan model yang lebih baik. Kesimpulannya dapatlah
dikatakan bahawa semakin banyak sifat di atas dipenuhi maka semakin baik sesuatu model
itu dihasilkan.
Pembentukan Model
Terdapat empat pemboleh yang terlibat dalam kajian ini iaitu satu pembolehubah bersandar
yang merujuk kepada Keluaran Dalam Negara Kasar (GDP) dan mengandungi tiga
pembolehubah tidak bersandar iaitu Jumlah Tenaga Buruh (LF), Saham Modal (SM), dan
Penggunaan Elektrik (EC). Model pembolehubah asal boleh dirangkumkan seperti dibawah :
LnGDP =
0+
Di mana
GDPt = Keluaran Dalam Negara Kasar pada tahun t
LF t
Spesifikasi Model
Berdasarkan teori dan kajian lepas yang telah dilakukan maka tata tanda dan saiz parameter
yang dikehendaki dapat ditentukan. Oleh disebabkan terdapat perbezaan unit antara
pembolehubah maka data telah diubah kepada bentuk ln linear bagi tujuan penganggaran dan
mengelak masalah spesifikasi dalam model. Berikut adalah model ln linear bagi kadar inflasi
yang telah dibentuk dalam Model Regresi Berbilang yang mana kaedah kuasa kedua terkecil
boleh digunakan iaitu:
pembolehubah bersandar dan ia dirujuk berdasarkan tanda dan saiz parameter yang akan
diperolehi melalui analisis yang dijalankan.
Dalam teori ekonomi pekali-pekali tersebut serta tanda dan saiznya didefinisikan iaitu syaratsyarat yang dikenakan kepada pekali-pekali tersebut, contohnya, Kecenderungan Mengguna
Sut (KMS) mestilah antara 0 dengan 1 atau 0 < KMS < 1.
Keanjalan ekonomi
Keanjalan adalah bertujuan untuk melihat kesan terhadap pembolehubah bersandar (Yt)
apabila berlaku kenaikan atau penurunan dalam nilai pembolehubah tidak bersandar (Xt).
Berikut merupakan kaedah yang digunakan untuk mengira nilai keanjalan model biasa adalah
seperti berikut:
Keanjalan X1t ke atas Yt =
dYt
dX1t
=
X1t
Yt
X 1t
Yt
Kaedah yang sama digunakan untuk mengira nilai keanjalan bagi pembolehubahpembolehubah X2, X3, dan X4.
Berdasarkan kepada kriteria ekonomi ini, pengkaji akan membentuk model yang terbaik dan
memenuhi kriteria penilaian yang lain. Daripada kajian yang dijalankan oleh pengkaji, dapat
dirumuskan seperti berikut:
Di mana, Keluaran Dalam Negara Kasar (InGDP) dipengaruhi oleh pembolehubahpembolehubah seperti Jumlah Tenaga Buruh (LFt), Saham Modal (SMt), Penggunaan
Elektrik (ECt).
Dalam statistik, pengkaji dapat melihat hubungan pembolehubah yang mempunyai perkaitan
yang tidak sempurna kerana terdapat unsur rawak yang bersifat stokastik iaitu pembolehubah
yang mempunyai taburan kebarangkalian tertentu. Oleh itu, kriteria statistik pada umumnya
akan ditentukan oleh teori statistik yang bertujuan untuk melihat kebenaran parameter yang
dianggarkan dalam sesuatu model. Antara kriteria statistik yang lazim digunakan ialah pekali
penentuan (R2) dan juga sisihan piawai. Kriteria statistik merupakan kriteria kedua yang
terpenting selepas kriteria statistik.
Sisihan piawai sesuatu parameter pula menentukan besarnya kesilapan yang dibuat
berbanding dengan parameter yang sebenarnya. Semakin besar nilai sisihan piawai bererti
kurang tepat sesuatu model itu daripada keadaan sebenarnya dan begitu juga sebaliknya.
Kriteria statistik merupakan perkara kedua terpenting selepas kriteria ekonomi. Sesuatu
parameter yang dianggarkan seharusnya ditolak seandainya didapati bahawa tanda dan
saiznya berlawanan dengan apa yang terdapat dalam teori ekonomi walaupun darjah pekali
penentuannya adalah tinggi ataupun sisihan piawainya kecil.
3.6.1
Pekali penentu adalah merujuk kepada nisbah variasi pembolehubah bersandar yang
dijelaskan atau ditentukan oleh pembolehubah bebas berbanding dengan variasi totalnya. Jadi
pekali ini boleh menentukan sejauh mana garisan regresi sampel (sample regression line)
akan sepadan (fit) dengan data-data dalam sampel yang digunakan untuk menganggar garisan
regresi populasi (population regression line). Statistik tersebut memberi maklumat bahawa
semakin dekat garisan regresi dengan data sampel, semakin baik garisan tersebut untuk
menerangkan perubahan pembolehubah bersandar yang disebabkan perubahan pembolehubah
penerang.
Dengan kata lain, nilai R2 digunakan bagi mengukur kesepadanan (fitness) sebarang model
regresi secara keseluruhannya. Dalam model regresi mudah, R 2 dikenali pekali penentuan
yang mempunyai satu sahaja pembolehubah tidak bersandar, manakala dalam model regresi
berbilang , R2 dikenali sebagai pekali penentuan berbilang yang mengandungi lebih daripada
satu pembolehubah bebas seperti yang digunakan oleh pengkaji dalam kajian terhadap faktorfaktor yang mempengaruhi kadar inflasi. Oleh itu, bagi kes empat pembolehubah, R2
didefinisikan sebagai nisbah antara variasi Yi yang dijelaskan secara bersama oleh R 2 dapat
dijelaskan secara bersama oleh X1, X2, X3 dan X4 (ESS) dibahagi dengan variasi Yi (TSS)
iaitu:
R2 =
3.6.2
Ujian kesignifikan secara individu hanya akan digunakan apabila saiz sampel tidak melebihi
daripada 30 atau kecil iaitu n < 30 manakala jika terdapat saiz sampel yang besar iaitu lebih
daripada 30 sampel (n > 30) pengkaji perlu menggunakan ujian z. Formula t statistik adalah
seperti:
ts
= (b2
2) /
se(b2)
= b2 / se(b2)
atau
t* = ( - )
Apabila se(b2) adalah penganggar kepada se(b2) sebenar. Berdasarkan taburan t, peraturan
membuat keputusan adalah seperti berikut:
Tolak Ho jika | t | > t /2,v
Terima Ho jika | t | t /2,v
Berdasarkan nilai t statistik, pengkaji boleh membandingkan nilai t genting yang diperoleh
kesimpulan bahawa data statistik menunjukkan ada hubungan yang ketara antara X dan Y.
Keputusan ini menyatakan X adalah penting dalam menerangkan Y. Tetapi jika nilai | t | t,
kita perlu terima Ho. Ini bermakna, data statistik kita tidak menunjukkan ada hubungan
ketara antara X dan Y. Ini bukan bermakna teori ekonomi yang menyatakan terdapat
hubungan antara X dan Y itu salah, tetapi data-data yang digunakan oleh pengkaji itu tidak
cukup kuat (tidak ketara) untuk menolak Ho yang bertentangan dengan teori ekonomi
berkenaan.
3.6.3
Ujian F digunakan untuk mengkaji kesignifikanan parameter yang dianggar pada darjah
kebebasan yang biasanya tidak melebihi 10%. Sekiranya Ujian F yang diperolehi
menunjukkan parameter yang dianggarkan adalah tidak signifikan, maka pembolehubah
penentu itu akan dikatakan tidak penting untuk digunakan sebagai penerangan dalam model
tersebut. Model yang cekap akan memberikan nilai F* yang lebih besar daripada nilai kritikal
F pada aras keertian , darjah kebebasan (k-1) dan (n-k) dengan n ialah bilangan cerapan dan
k ialah bilangan parameter dalam model.
Formulanya adalah seperti berikut:
F = ESS / df
RSS / df
Apabila :
df = darjah kebebasan (degree of freedom)
Perhubungan antara R2 dengan F adalah seperti berikut:
F =
R2 / (k-1)
(1-R2) / (n-k)
Apabila:
k = bilangan parameter dalam model
n = saiz sampel
Nilai F statistik boleh diperoleh daripada output SPSS yang diberikan dalam jadual anova
(analysis of variance). Dengan menggunakan ujian F, kita boleh menolak Ho jika F statistik
lebih besar daripada F genting dan sebaliknya kita tidak boleh menolak Ho jika F statistik
sama atau lebih kecil daripada F genting. Nilai F genting boleh diperoleh daripada jadual F.
3.6.4
Jumlah kuasa dua variasi Yi sebenar di sekitar min sampel yang digelarkan jumlah kuasa dua
total (TSS) iaitu:
yi2 = TSS
Oleh itu, TSS adalah penting untuk mendapatkan nilai R2
3.6.5
Jumlah kuasa dua variasi Yi teranggar di sekitar minnya yang digelarkan jumlah kuasa dua
yang dijelaskan (ESS) iaitu:
y^i2 = ESS
atau
ESS = TSS RSS
ESS juga digunakan dalam menentukan nilai R2
3.6.6
Jumlah kuasa dua variasi Yi yang tidak dijelaskan oleh X dan digelarkan jumlah kuasa dua
ralat sampel (RSS) iaitu:
ei2 = RSS
atau
^
3.7.1
Multikolineariti
Salah satu andaian klasik bagi model regresi berbilang ialah tidak terdapat multikolineariti
atau ringkasnya MC dalam kalangan pembolehubah tidak bersandar yang dimasukkan dalam
model. Ini bermakna tidak terdapat perhubungan antara X1, pembolehubah bebas pertama
dengan X2 iaitu pembolehubah bebas kedua dan seterusnya dengan Xk, iaitu pembolehubahpembolehubah bebas yang lain.
Terma MC mula digunakan oleh Ragnar Frish. Ia membawa maksud bahawa terdapat
perhubungan
linear
sempurna
(perfect)
dalam
kalangan
sebahagian
atau
semua
Heterokidastisiti
Salah satu daripada andaian model regresi linear klasik ialah varian kepada tiap-tiap cerapan
terma gangguan (disturbance term), iaitu varian ui adalah malar (constant). Dalam bentuk
notasi, andaian ini ditulis sebagai var(ui) = E(ui)2 = 2 . Jika andaian ini dipenuhi ia dikenali
sebagai homoskedastisiti yang merujuk kepada variasi atau varian yang sama. Tetapi jika
tidak dipenuhi terdapatlah apa yang dikenali sebagai heteroskedastisiti, iaitu variannya
berubah-ubah. Homoskedastisiti merujuk kepada varian ui yang sama nilainya antara cerapan
pertama apabila nilai pertama pembolehubah bebas X1 diberi.
Selain itu, untuk mengesan heterokidastisiti, ia boleh dilakukan berdasarkan kepada beberapa
kaedah seperti yang berikut:
1) Kaedah Grafik
Kaedah ini dapat dilakukan dengan membuat plot kuasa dua ralat sampel, iaitu ei2 pada paksi
menegak dengan pembolehubah bebas, iaitu X1 pada paksi mendatar. Daripada corak taburan
plot ini, kita dapat mengenalpasti sama ada ralatnya bercorak homoskedastisiti atau
hetrokedastisiti. Jika corak taburannya seragam, ini menunjukkan varian ui adalah
homoskedastisiti dan sebaliknya varian ui adalah hetroskedastisiti.
2) Ujian Park (Park Test)
Park telah menegaskan kuasa dua ralat sampel, iaitu ei2 ke atas pembolehubah bebas, iaitu Xi
dengan menggunakan model tidak linear atau log-linear seperti di bawah ini:
Ln ei2 = ln 2 + ln Xi + vi
Jika didapati penganggar kepada iaitu b adalah signifikan bukan bernilai 0, iaitu nilai
mutlak t statistiknya melebihi 2.0 (mengikut peraturan ibu jari), maka jelas terdapat
perhubungan antara ralat dengan pembolehubah bebas itu. Ini menunjukkan terdapatnya
heterokidastisiti.
| ui | = 1 + 2 1 + vi
Xi
| ui | = 1 + 2 1 + vi
Xi
| ui | = 1 + 2 Xi + vi
| ui | = 1 + 2 X2i + vi
mana Vi adalah istilah ralat.
Sekali lagi sebagai perkara empirikal atau praktikal, seseorang boleh menggunakan
pendekatan Glejser itu. tetapi Goldfeld dan Quandt menunjukkan bahawa V i ralat jangka
mempunyai beberapa masalah dalam bahawa yang dijangka nilai adalah bukan sifar, ia bersiri
berkorelasi, dan, ironinya, ia adalah heteroskedastik. An kesukaran tambahan dengan kaedah
Glejser adalah bahawa model seperti
| ui| = 1 + 2Xi + vi
dan
| ui| = 1 + 2 X2i + vi
adalah tak linear dalam parameter dan oleh itu tidak boleh dianggarkan dengan OLS biasa
prosedur.
Glejser telah mendapati bahawa sampel besar yang pertama empat daripada model
sebelumnya memberi keputusan amnya memuaskan dalam mengesan heteroskedastisiti.
Sebagai perkara yang praktikal, oleh itu, teknik Glejser itu boleh digunakan untuk sampel
besar dan boleh digunakan dalam kecil sampel ketat sebagai alat kualitatif untuk belajar
sesuatu tentang heteroskedastisiti.
3.7.3
Autokorelasi
Salah satu andaian model regresi linear klasik ialah tidak ada perhubungan antara satu
gangguan (disturbance) atau ralat dengan gangguan atau ralat yang lain. Ini bermakna, nilai
ralat daripada cerapan (observation) yang pertama tidak mempengaruhi nilai ralat daripada
cerapan kedua, ketiga dan seterusnya. Andaian klasik ini boleh ditulis dalam bentuk simbol
statistik seperti berikut:
E( ui, uj ) = 0
apabila i = j
Penyataan simbol statistik itu bermakna perhubungan antara ralat yang ke-i dengan ralat yang
ke-j adalah kosong (tiada hubungan atau korelasi antara kedua ralat berkenaan).
Sebaliknya, jika terdapat perhubungan antara keduanya, iaitu:
E( ui, uj ) 0
apabila i 0
Pernyataan simbol statistik ini pula bermakna perhubungan antara ralat yang ke-i dengan ralat
yang ke-j adalah bukan kosong (ada hubungan atau korelasi antara kedua ralat berkenaan).
Oleh itu, dalam kes yang baru ini, wujudlah masalah autokorelasi dalam model regresi yang
hendak dianggarkan. Ini juga bermakna nilai ralat pada cerapan yang ke-i, iaitu ui akan
mempengaruhi nilai ralat pada cerapan yang ke-j, iaitu uj. Ralatnya bukan lagi rawak seperti
yang dikehendaki oleh andaian klasik. Inilah yang dimaksudkan dengan autokorelasi.
Faktor-faktor yang menyebabkan autokorelasi :
1. Inertia merupakan keadaan melambung dan meleset. Jika penggunaan sebenar kurang
daripada penggunaan yang dijangka, maka terdapat ralat yang negatif. Dan ralat tahun berikut
dipengaruhi oleh ralat tahun sebelumnya.
2. Salah spesifikasi bentuk fungsi model iaitu meninggalkan pembolehubah bebas penting
yang sepatutnya dimasukkan ke dalam model. Pembolehubah yang ditinggalkan termasuk
dalam nilai ralat. Ralat pada cerapan pertama akan mempengaruhi ralat pada cerapan kedua
dan seterusnya.
3. Model yang sepatutnya tidak linear dijadikan linear.
4. Ralat dalam sebutan yang sebenarnya iaitu berpunca daripada nilai itu sendiri.
3.8
KAEDAH PENGANGGARAN
Kaedah penganggaran digunakan oleh pengkaji bagi melihat sejauhmana ketepatan statistik
sampel sebagai penganggar kepada parameter populasi yang biasanya tidak diketahui.
Kaedah yang boleh digunakan oleh pengkaji adalah Kaedah Kuasa Dua Terkecil atau
Ordinary Least Square (OLS).
3.8.1
OLS atau kaedah Penganggaran Kuasa Dua Terkecil merupakan kaedah penganggaran yang
paling popular bagi menganggarkan parameter yang terdapat dalam model hipotesis. Terdapat
banyak sebab kaedah ini digunakan, antaranya adalah:
i) Penganggaran parameter dengan menggunakan kaedah ini akan menghasilkan parameter
yang bersifat optimum.
ii) Cara pengiraan dengan menggunakan kaedah ini adalah mudah jika dibandingkan dengan
kaedah ekonometrik yang lain dan kaedah ini tidak memerlukan data yang banyak.
iii) Kaedah kuasa dua terkecil ini digunakan secara meluas dalam hubungan ekonomi dan
kebanyakannya menghasilkan keputusan yang baik. Dengan yang demikian, ia menyebabkan
kaedah ini sangat popular digunakan semasa menganggarkan hubungan dalam model
ekonometrik.
iv) Kaedah kuasa dua terkecil adalah komponen yang penting dalam kebanyakan kaedah
ekonometrik.
Sesuatu penganggar juga dikatakan paling baik apabila variannya adalah paling kecil jika
dibandingkan dengan penganggar yang didapati daripada kaedah-kaedah lain dalam
ekonometrik. Ia dikatakan cekap sekiranya ia memenuhi syarat-syarat berikut:
i) Penganggarnya saksama.
ii) Ia mempunyai varians yang paling kecil berbanding dengan varians parameter yang lain
yang saksama.
3.8.2
Teori ini menjamin bahawa untuk menganggarkan model statistik atau model ekonometrik
yang dibentuk, penganggar yang menggunakan teknik kuasa dua terkecil (OLS) adalah yang
terbaik. Ini bermakna, jika dibandingkan dengan penganggar linear yang lain yang tidak bias,
penganggar OLS adalah yang terbaik, iaitu mempunyai variabiliti pensampelan yang
minimum. Pernyataan teori ini, dapat diringkaskan kepada BLUE (Best Linear Unbiased
Estimator) yang membawa maksud penganggar linear tidak bias yang terbaik.