1.1 Pengantar
“What is econometrics?”
measurement. Ekonometri memiliki cakupan yang sangat luas, seperti: bisnis, ekonomi,
sosial dan sebagainya. Sebagai contoh adalah penggunaan ekonometri untuk analisis
dampak promosi terhadap penjualan, dampak kenaikan harga BBM terhadap permintaan
BBM, dampak kenaikan SPP terhadap permintaan sekolah, dampak kenaikan jasa
transportasi terhadap penawaran jasa transportasi, dampak kenaikan tarif dasar listrik
Disisi lain, apabila ekonometri dilihat dari perspektif teoritis, beragam pendapat para
ahli tentang konteks ekonometri itu sendiri. Kesemuanya menunjukkan bahwa ekonoemtri
“Econometrics, the result of a certain outlook on the role of economics, consits of the apllication of
mathematical statistics to economic data to lendempirical support to the models constructed by
....econometrics may be defined as the quantitative analysis of actual economic phenomena based on
inference.2
Sekarang ini, ekonometri merupakan suatu metode yang lazim digunakan untuk keperluan
1
Sederhananya, ekonometri berusaha menterjemahkan suatu masalah dari aspek ekonomi,
matematik ekonomi dan statistik ekonomi secara komprehensif. Ketiga bidang ilmu itu
menganalisis permasalahan yang ada. Sebagai contoh adalah harga minyak mentah dan
permintaan minyak mentah. Berdasarkan teori ekonomi, dengan asumsi barang normal,
harga berbanding terbalik dengan permintaan dan berbanding lurus dengan penawaran.
Artinya, berdasarkan hukum permintaan, jika harga minyak mentah naik, maka permintaan
minyak mentah akan mengalami penurunan. Sebaliknya, jika harga minyak mentah turun,
maka permintaan akan minyak mentah mengalami kenaikan. Sedangkan berdasarkan hukum
penawaran, jika harga minyak mentah naik maka penawaran minyak mentah akan
mengalami kenaikan, dan sebaliknya jika terjadi penurunan harga. Akan tetapi, teori
ekonomi tidak menjelaskan lebih lanjut berapa besar dampak kenaikan harga terhadap
ekonomi dalam bentuk matematika atau persamaan matematika. Tujuannya adalah untuk
verifikasi empiris atas teori ekonomi yang berlaku. Dan hal ini akan lebih mudah apabila
Fokus dari statistik ekonomi adalah berkaitan dengan pengumpulan data, pengolahan data,
dan analisis data. Data bisa dinyatakan dalam grafik, diagram ataupun tabel. Jadi dari
aspek statistik, data merupakan “bahan mentah” yang harus diolah lebih lanjut dalam
ekonometri. Data yang berasal dari berbagai publikasi baik swasta atau pemerintah
bersifat given. Artinya, data mentah itu diluar kontrol econometrician apabila data
mengandung kesalahan pengukuran, dan berbagai kesalahan lainnya. Oleh karena itu,
2
1.2 Metodologi Ekonometri
Yang menjadi pertanyaan lebih lanjut adalah bagaimana prosedur baku ekonometrik bisa
digunakan untuk menganalisis permasalahan ekonomi. Atau dengan kata lain, bagaimana
matematis dan penggunaan data mentah sampai pada analisis masalah, adalah prosedur
baku yang digunakan dalam ekonometri. Metodologi yang digunakan dalam ekonometrik
Contoh 1
Akbar adalah manajer penjualan ayam goreng “Selalu Renyah” di kota Depok. Dia harus
menyiapkan strategi yang tepat untuk mempertahankan tingkat penjualan tahun ini.
Berdasarkan data jumlah biaya promosi dan besarnya penjualan ayam goreng, dilihat ada
hubungan positif antara promosi dan penjualan. Dia merencanakan promosi besar-besaran
dengan memasang spanduk di seluruh sudut kota Depak. Untuk meyakinkan atasannya, dia
mengalami peningkatan.
3
Hubungan antara penjualan (y) dan promosi (x) bisa dinyatakan sebagai hubungan
dinyatakan dengan
y = β1 + β 2 x .......
(1)
Variabel bebas (x) dinyatakan di sebelah kanan persamaan dan variabel tidak
bebas atau dependent variable (y) dinyatakan di sebelah kiri persamaan. β 1 dan
dengan nol. β 2 juga disebut dengan slope. Slope menyatakan berapa besar
perubahan tingkat penjualan jika promosi berubah sebesar satu satuan. Untuk
penjualan yang dinyatakan dengan unit dan promosi dengan Rp juta, maka slope
Secara grafis, hubungan yang linier dan non linier dari penjualan dan promosi
y y
penjualan penjualan
1
x x
promosi promosi
fungsi model yang tepat untuk menyatakan permasalahan yang ada. Dan ini akan
4
3. Spesifikasi statistik atau ekonometrika
Dalam model matematik, pada umumnya hubungan antar variabel (misal: penjualan
Padahal dalam kondisi riil, banyak sekali hubungan antar variabel yang tidak dapat
dinyatakan secara eksak. Untuk melihat hal ini, dapat dibuat scatter diagram.
Dari scatter diagram dapat dilihat pola persebaran data. Sebagai contoh, dapat
dilihat bagaimana persebaran data antara set data penjualan dan promosi pada
60
Penjualan
40
Series1
20
0
0 200 400 600
Promosi
bisa dikatakan linier tetapi tidak exact linier karena ada beberapa data yang
tidak tepat di dalam garis. Untuk membuat sebuah garis hanya dibutuhkan dua
titik. Dan ternyata tidak semua titik berada pada garis tersebut.
5
Dalam konteks hubungan penjualan dan promosi, yang perlu diingat adalah promosi
y = β1 + β 2 x + u .......
(2)
Dimana u disebut dengan random error term atau lebih sering disebut dengan
4. Pengumpulan Data
Salah satu hal penting dalam prosedur ekonometrik adalah pengumpulan data.
Econometrician harus menentukan data yang tepat berdasarkan model yang sudah
analisis yang akan dibuat. Ada beberapa jenis data yang lazim digunakan untuk
• Time Series
sebagainya.
• Cross-Section
Cross-Section adalah data dari satu atau lebih variabel yang dikumpulkan
pada titik waktu tertentu. Seperti, data tingkat penjualan dan promosi
• Pooled
Seperti, data tingkat penjualan dan promosi mobil “Atoz” pada tahun
6
5. Estimasi Parameter
Dengan menggunakan set data penjualan dan promosi, dapat dilakukan estimasi
y = -0.321 + 0.103* x
6. Pengujian Hipotesa
confirm antara hasil empiris dengan teori ekonomi yang berlaku, bagaimana peran
dengan nilai koefisien promosi yang nilainya ternyata sangat kecil? Bagaimana
relevansi hasil pengujian dengan teori yang berlaku? Kesemuanya itu harus
7. Peramalan
1.3 Model Regresi Linier Sederhana (Ordinary Least Square): Kerangka Dasar
Model regresi linier sederhana melihat hubungan antara dua variabel. Salah satu variabel
menjadi variabel independen dan yang lain menjadi variabel dependen. Hubungan antara
dua variabel tersebut dapat dilihat secara visual melalui plot dari pasangan data untuk
variabel yang diteliti atau sering dikenal dengan scatterplot. Biasanya pasangan data
tersebut tidak selalu tepat sama (exactly) dengan garis lurus yang menunjukkan
hubungan antara promosi dan penjualan. Persebaran data di seputar garis lurus tersebut
7
lebih mencerminkan kecenderungan lemah atau kuatnya hubungan antara promosi dan
penjualan. Garis lurus mencerminkan hubungan antara dua variabel secara rata-rata.
Y
Y
Y
X 0 X X
Y
Y
X X X
Ketika pemetaan masalah sudah dilakukan (hubungan antara promosi dan penjualan),
selanjutnya perlu dibangun model yang menyatakan hubungan tersebut. Dalam hal ini
(i) Data
tidak selalu tepat sama pada garis lurus, atau persebaran data lebih
Dalam hal ini, perlu diketahui perbedaan komponen sistematik pada ANOVA dan regresi.
Pada ANOVA, komponen sistematik adalah variasi rata-rata antara sampel atau
tratment, dan komponen random adalah variasi yang tidak bisa dijelaskan. Sedangkan
pada regresi, komponen sistematik adalah keseluruhan hubungan linier dan komponen
8
Sebagai contoh dari model regresi sederhana adalah hubungan antara promosi dan
tingkat penjualan. Variabel promosi diperlakukan sebagai variabel independen dan diplot
pada sumbu x. Sedangkan variabel penjualan diperlakukan sebagai variabel dependen dan
diletakkan pada sumbu y. Pada umumnya penentuan status suatu variabel, apakah sebagai
variabel dependen atau independen tergantung dari teori yang berlaku. Untuk kasus dua
dependen.
Untuk kasus regresi sederhana, yang dilihat adalah hubungan antara dua variabel.
Sedangkan untuk lebih dari dua variabel, dikenal dengan istilah regresi berganda.
Y= β0 + β1 X + ε
Atau komponen
sistematik
adalah variabel yang digunakan untuk memprediksi atau dikenal juga dengan variabel
independen atau variabel prediksi, ε adalah error term, satu-satunya komponen random
β0 adalah intersep dari komponen sistematik dalam hubungan regresi dan β1 adalah slope
dari komponen sistematik. Rata-rata (conditional mean) y dapat dihitung dengan rumus
berikut:
E [Y X ] = β 0 + β1 X
9
Gambar 2 Model Regresi Linier Sederhana
Y
Regression Plot
E[Y]=β0 + β1 X
Yi
{
Error: εi } β1 = Slope
}
1
β0 = Intercept
X
Xi
Model Regresi Linier Sederhana menunjukkan hubungan yang tepat sama (exact) antara
E[Yi] = β0 + β1 Xi
Perbedaan antara nilai riil dan nilai ekspektasi dari y dijelaskan dalam random error.
Yi = E[Yi] + εi
= β0 + β1 Xi + εi
Model Regresi Linier Sederhana memiliki beberapa asumsi dasar yang harus dipenuhi
untuk menghasilkan estimasi yang baik atau dikenal dengan BLUE ( Best Linier Unbiased
dan no-autocorrelation.
Selanjutnya, yang perlu diketahui adalah, dalam konteks pendugaan koefisien regresi
sampel, secara umum, metode OLS sudah diterima sebagai suatu kriteria yang baik. Tidak
dibutuhkan asumsi-asumsi lebih lanjut. Akan tetapi, dalam konteks inferensi regresi,
yaitu dalam pembuatan pendugaan interval dan pengujian parameter regresi populasi,
2. Variabel bebas memiliki nilai yang tetap untuk sampel yang berulang (bersifat
nonstokastik). Implikasinya, variabel bebas tidak berhubungan dengan error
term. Atau kovarian antara variabel bebas dan error term dinyatakan dengan
10
(u i , X i ) =∈ [ X i − ∈ ( X i )][u i − ∈ (u i )] = 0
∈ (u i X i ) = 0 dan Var (u i X i ) = σ 2
E[Y]=β0 + β1 X
Identical normal
distributions of errors,
all centered on the
regression line.
Hasil estimasi OLS sering disebut dengan istilah BLUE (Best Linier Unbiased
1. Efisien, artinya hasil nilai estimasi memiliki varian yang minimum dan tidak
bias.
2. Tidak bias, artinya hasil nilai estimasi sesuai dengan nilai parameter.
3. Konsisten, artinya jika ukuran sampel ditambah tanpa batas maka hasil nilai
11
Apabila asumsi normalitas terpenuhi (syarat 3c) dimana error terdistribusi
secara normal dengan rata-rata sama dengan nol dan standar deviasi konstan atau
Estimasi dari model regresi sederhana bertujuan untuk mendapatkan nilai intersep dan
Y=b0 + b1X + e
Keterangan:
b0 adalah estimasi untuk intersep garis regresi populasi, atau dinotasikan dengan β0
e adalah observed errors – residu antara garis regresi populasi b0 + b1X dengan titik-
titik observasi.
Yˆ = b0 + b1 X
Ŷ menunjukkan nilai Y yang terletak pada “fitted” regression line untuk berbagai nilai X.
Y Y
Gambar 4 Fitting a Regression Line
Data
Three errors from the
least squares regression
X line X
Y e
Three errors 12
Errors from the least
from a fitted line squares regression
line are minimized
X X
Metode estimasi yang sering digunakan untuk mengestimasi fungsi regresi populasi
dari fungsi regresi sampel adalah metode OLS. Kriteria dari OLS adalah "line of best
fit" atau dengan kata lain, jumlah kuadrat dari deviasi antara titik-titik observasi
dengan garis regresi adalah minimum. "Line of best fit" adalah garis yang memiliki
∑e² paling kecil. Berkaitan dengan konteks kuadarat error yang minimum, best
fitting line disebut dengan least square line. Least square line dapat ditentukan
dengan menghitung set observasi (x,y) data. Perhitungan tersebut menghasilkan nilai
sebagai berikut:
Yi = b0 + b1 X i + ei
Dengan memasukkan persamaan pada point (1) di atas diperoleh
Yi = Yi + ei
Yi
{
Error ei = Yi − Yi
Yi the predicted value of Y for X
i
13
X
Dari beberapa persamaan di atas dapat disimpulkan bahwa garis regresi sampel
yang paling mendekati garis regresi populasi adalah yang meminimumkan kuadrat
1. ∑ ei2
2. ∑(Yi − Yi ) 2
3. ∑(Yi − b0 − b1 X i ) 2
Untuk Y = b0 + b1 X , nilai b0 dan b1 diperoleh berdasarkan rumus:
ΣY − b1 (ΣX )
b0 =
n
dimana n adalah jumlah data atau banyaknya observasi. Rumus di atas akan menjadi
lebih sederhana jika variabelnya dinyatakan dalam bentuk deviasi standar terhadap
rata-rata sampel.
Jika x=X −X
y = Y −Y
maka rumus a dan b dapat dinyatakan dengan
Σxy
b1 = dan b0 = Y − b1 X
Σx 2
14
1. Garis regresi sampel akan melalui X dan Y yang merupakan rata-rata dari
variabel X dan Y yang diperoleh dari sampel.
Berikut ini adalah contoh data dua variabel, x dan y, untuk dijadikan latihan dalam
Contoh 1
x y x2 xy
15
5439 6964 29582720 37877196
Jawab:
(∑ x) 2
SS x = ∑( x − x ) = ∑ x −
2 2
n
(∑ y ) 2
SS y = ∑( y − y ) 2 = ∑ y 2 −
n
(∑ x)(∑ y )
SS xy = ∑( x − x )( y − y ) = ∑ xy −
n
Sedangkan rumus untuk least square regression estimator adalah:
SS XY
b1 =
SS X
b0 = y − b1 x
Untuk mencari nilai b0 dan b1 dapat dibuat prosedur pengerjaan sebagai rumus di atas:
2
2 ( ∑ x)
SS x = ∑ x −
n
2
79448
= 293426944 − = 40947552
25
( )
∑ x (∑ y)
SS xy = ∑ xy −
n
2
106605
= 390185024 − = 51402848
25
SS XY 51402848
b1 = = = 1.255333776 ≈ 1.26
SS X 40947552
106605 79448
− (1.255333776)
b0 = y − b1 x =
25 25
= 274 .85
16
Analisis Regresi dari kasus di atas adalah:
y = 275 + 1.26 x
Analysis of Variance
SOURCE DF SS MS F p
Total 24 66855896
Selanjutnya dibahas Error Variance dan the Standard Errors of Regression Estimators.
Perlu diperhatikan, sebelum melakukan pengerjaan lebih lanjut, pertama kali harus
ditentukan derajat kebebasan (degree of freedom). Dalam hal ini, derajat kebebasan
sebesar df = (n-2)
Keterangan:
( SS XY ) 2
SSE = ∑( y − y ) = SS y −
2
SS X
SSE = SS Y − b1 SS XY
Estimator yang tidak bias (unbiased estimator) dari s2 ditunjukkan pada rumus berikut:
SSE
MSE =
n−2
Berdasarkan contoh di atas, bisa dicari nilai dari SSE sebagai berikut:
17
SSE = SS Y − b1 SS XY
SSE = 66855898 − (1.255333776)(51402852.4)
SSE = 2328161.2
SSE 2328161.2
MSE = =
n−2 23
MSE = 101224.4
S = MSE
S = 101284.4
S = 318.158
Standar Error estimasi regresi dari soal di atas dapat diselesaikan dengan rumus
berikut:
s ∑ x2
s (b0) =
nSS x
s = MSE
s
s (b1) =
SS X
Masih merujuk soal di atas, dapat dicari standar error dari b0 dan b1 sebagai berikut:
s ∑ x2
s (b0) =
nSS x
318.158 293426944
s (b0) = = 170.338
(25)(4097557.84)
s
s (b1) =
SS X
318.158
s (b1) = = 0.04972
409
18
Interval keyakinan dari parameter regresi dirumuskan sebagai berikut:
Mengacu pada soal di atas, nilai dari tingkat kepercayaan 95% adalah:
Salah satu topik penting yang perlu dipahami, yaitu analisis korelasi. Sederhananya,
analisis korelasi adalah suatu alat statistik untuk menunjukkan seberapa besar tingkat
(degree) hubungan suatu variabel secara “linier” terhadap variabel lain. Korelasi itu
sendiri menyatakan tingkat hubungan atau keterkaiatan antara dua variabel. Seringkali
analisis korelasi ini digunakan secara bersama-sama dengan analisis regresi untuk
mengukur seberapa tepat garis regresi mampu menjelaskan variasi variabel dependen.
Ada dua ukuran yang mencerminkan korelasi antara dua variabel, yaitu: koefisien
kesesuaian model, atau dinotasikan dengan R2. Indikator ini menyatakan seberapa besar
variasi dari variabel bebas (X) mampu menjelaskan perubahan variabel terikat (Y).
19
Sedangkan untuk koefisien korelasi, dalam hal ini korelasi populasi, dinotasikan dengan p,
memiliki nilai dari -1 ke 1. Ada beberapa ragam nilai korelasi yang menunjukkan
relationship)
relationship)
Y ρ=- Y ρ= Y ρ=
1 0 1
X X X
Y ρ=- Y ρ= Y ρ=.
.8 0 8
X X X
Cov ( X , Y )
ρ=
σ XσY
Sedangkan untuk koefisien korelasi sample dirumuskan dengan:
20
SS XY
r=
SS X SS Y
Merujuk soal di atas, bisa dicari koefisien korelasi sampel sebagai berikut:
SS XY
r=
SS X SS Y
51402852.4 51402852.4
r= = = 0.982
( 409475578)(6655589) 5232191.2
Selanjutnya, pembahasan tentang berbagai uji dalam regresi sederhana akan dibahas
pada modul 3. Modul 2 lebih menekankan uji hipotesis dan confidence interval dari
perspektif teoritis. Hal ini bertujuan agar filosofi dasar dari uji hipotesis dapat dipahami
dengan baik.
21