Anda di halaman 1dari 21

EKONOMETRI: SUATU PENGANTAR &

REGRESI SEDERHANA:KERANGKA DASAR


Arief yulianto

1.1 Pengantar

“What is econometrics?”

Sederhananya, “ekonometrik” diartikan sebagai “ukuran ekonomi” atau economic

measurement. Ekonometri memiliki cakupan yang sangat luas, seperti: bisnis, ekonomi,

sosial dan sebagainya. Sebagai contoh adalah penggunaan ekonometri untuk analisis

dampak promosi terhadap penjualan, dampak kenaikan harga BBM terhadap permintaan

BBM, dampak kenaikan SPP terhadap permintaan sekolah, dampak kenaikan jasa

transportasi terhadap penawaran jasa transportasi, dampak kenaikan tarif dasar listrik

(TDL) terhadap permintaan listrik dan sebagainya.

Disisi lain, apabila ekonometri dilihat dari perspektif teoritis, beragam pendapat para

ahli tentang konteks ekonometri itu sendiri. Kesemuanya menunjukkan bahwa ekonoemtri

memiliki cakupan pembahasan yang luas.

“Econometrics, the result of a certain outlook on the role of economics, consits of the apllication of
mathematical statistics to economic data to lendempirical support to the models constructed by

mathematical economics and to obtain numerical results.1

....econometrics may be defined as the quantitative analysis of actual economic phenomena based on

concurrent development of the theory and observation, related by appropriate methods of

inference.2

“Econometrics is concerned with the empirical determination of economic laws.3

Sumber: Gujarati, 2003, hlm.1

Sekarang ini, ekonometri merupakan suatu metode yang lazim digunakan untuk keperluan

peramalan. Dalam konteks permasalahan ekonomi, ekonometri bisa diterjemahkan

sebagai art of science dalam menawarkan solusi berbagai masalah ekonomi.


1
Gerhard Tintner, Methodology of Mathematical Economics and Econometrics, The University of
Chicago Press, Chicago, 1968, p.74.
2
P.A Samuelson, T.C Koopmans, and J.R.N. Stone, “Report of the Evaluative Committee for
Econometrica,” Econometrica, vol.22, no.2, April 1954, pp. 141-146.
3
H. Theil, Principles of Econometrics, John Wiley & Sons, New York, 1971, p.1.

1
Sederhananya, ekonometri berusaha menterjemahkan suatu masalah dari aspek ekonomi,

matematik ekonomi dan statistik ekonomi secara komprehensif. Ketiga bidang ilmu itu

merupakan pondasi dalam penerapan ekonometri.

Dalam ekonometri, permasalahan dipetakan berdasarkan teori (ekonomi) yang ada,

dinyatakan dengan persamaan matematik dan digunakan kriteria statistik untuk

menganalisis permasalahan yang ada. Sebagai contoh adalah harga minyak mentah dan

permintaan minyak mentah. Berdasarkan teori ekonomi, dengan asumsi barang normal,

harga berbanding terbalik dengan permintaan dan berbanding lurus dengan penawaran.

Artinya, berdasarkan hukum permintaan, jika harga minyak mentah naik, maka permintaan

minyak mentah akan mengalami penurunan. Sebaliknya, jika harga minyak mentah turun,

maka permintaan akan minyak mentah mengalami kenaikan. Sedangkan berdasarkan hukum

penawaran, jika harga minyak mentah naik maka penawaran minyak mentah akan

mengalami kenaikan, dan sebaliknya jika terjadi penurunan harga. Akan tetapi, teori

ekonomi tidak menjelaskan lebih lanjut berapa besar dampak kenaikan harga terhadap

perubahan permintaan. Di sini, ekonometri berperan dalam memberikan ukuran atas

besarnya perubahan permintaan sebagai akibat dari perubahan harga.

Berkaitan dengan ekonometri, peran matematika ekonomi adalah menyatakan teori

ekonomi dalam bentuk matematika atau persamaan matematika. Tujuannya adalah untuk

penyederhaan masalah. Seperti dibahas sebelumnya, ekonometri berusaha melakukan

verifikasi empiris atas teori ekonomi yang berlaku. Dan hal ini akan lebih mudah apabila

permasalahan ekonomi dinyatakan dalam bentuk matematik.

Fokus dari statistik ekonomi adalah berkaitan dengan pengumpulan data, pengolahan data,

dan analisis data. Data bisa dinyatakan dalam grafik, diagram ataupun tabel. Jadi dari

aspek statistik, data merupakan “bahan mentah” yang harus diolah lebih lanjut dalam

ekonometri. Data yang berasal dari berbagai publikasi baik swasta atau pemerintah

bersifat given. Artinya, data mentah itu diluar kontrol econometrician apabila data

mengandung kesalahan pengukuran, dan berbagai kesalahan lainnya. Oleh karena itu,

econometrician mengembangkan metode untuk mengatasi berbagai masalah berkaitan

dengan kesalahan pengukuran.

2
1.2 Metodologi Ekonometri

Yang menjadi pertanyaan lebih lanjut adalah bagaimana prosedur baku ekonometrik bisa

digunakan untuk menganalisis permasalahan ekonomi. Atau dengan kata lain, bagaimana

“metodologi” ekonometri. Berangkat dari teori ekonomi, menyatakan masalah secara

matematis dan penggunaan data mentah sampai pada analisis masalah, adalah prosedur

baku yang digunakan dalam ekonometri. Metodologi yang digunakan dalam ekonometrik

adalah sebagai berikut :

1. Pernyataan teori atau pembuatan hipotesa berdasarkan teori

2. Menyatakan teori dalam persamaan atau model matematik

3. Melakukan spesifikasi statistik atas model yang sudah dibuat

4. Pengumpulan data yang dibutuhkan

5. Melakukan estimasi parameter dari model ekonometri yang sudah ditentukan

6. Pengujian hipotesa yang diturunkan dari model

7. Membuat peramalan berdasarkan data yang tersedia

8. Penggunaan model sebagai referensi kebijakan

Untuk memudahkan penterjemahan metodologi di atas, dibuat contoh yang sangat

sederhana sebagai berikut.

Contoh 1

Akbar adalah manajer penjualan ayam goreng “Selalu Renyah” di kota Depok. Dia harus

menyiapkan strategi yang tepat untuk mempertahankan tingkat penjualan tahun ini.

Berdasarkan data jumlah biaya promosi dan besarnya penjualan ayam goreng, dilihat ada

hubungan positif antara promosi dan penjualan. Dia merencanakan promosi besar-besaran

dengan memasang spanduk di seluruh sudut kota Depak. Untuk meyakinkan atasannya, dia

membuat analisis ekonometri antara promosi dan penjualan sebagai berikut.

1. Pernyataan berdasarkan teori

Berdasarkan teori pemasaran dapat dinyatakan bahwa promosi berbanding positif

terhadap penjualan. Artinya, semakin besar biaya promosi, penjualan akan

mengalami peningkatan.

2. Spesifikasi Model Matematik

3
Hubungan antara penjualan (y) dan promosi (x) bisa dinyatakan sebagai hubungan

linier ataupun non-linier. Untuk persamaan linier, hubungan x dan y dapat

dinyatakan dengan

y = β1 + β 2 x .......

(1)

Variabel bebas (x) dinyatakan di sebelah kanan persamaan dan variabel tidak

bebas atau dependent variable (y) dinyatakan di sebelah kiri persamaan. β 1 dan

β 2 disebut sebagai parameter. β 1 disebut dengan intersep ketika nilai x sama

dengan nol. β 2 juga disebut dengan slope. Slope menyatakan berapa besar
perubahan tingkat penjualan jika promosi berubah sebesar satu satuan. Untuk

penjualan yang dinyatakan dengan unit dan promosi dengan Rp juta, maka slope

dapat diartikan dengan berapa unit perubahan penjualan jika promosi

ditingkatkan sebesar Rp 1 juta.

Secara grafis, hubungan yang linier dan non linier dari penjualan dan promosi

ayam goreng dapat ditunjukkan sebagai berikut:

a.Fungsi Linier b. Fungsi Non-Linier

y y

penjualan penjualan
1

x x

promosi promosi

Yang menjadi topik bahasan utama adalah bagaimana econometrician merumuskan

fungsi model yang tepat untuk menyatakan permasalahan yang ada. Dan ini akan

dibahas lebih lanjut pada topik pemilihan model dan analisisnya.

4
3. Spesifikasi statistik atau ekonometrika

Dalam model matematik, pada umumnya hubungan antar variabel (misal: penjualan

dan promosi) dinyatakan sebagai hubungan yang “eksak” atau “deterministik”.

Padahal dalam kondisi riil, banyak sekali hubungan antar variabel yang tidak dapat

dinyatakan secara eksak. Untuk melihat hal ini, dapat dibuat scatter diagram.

Dari scatter diagram dapat dilihat pola persebaran data. Sebagai contoh, dapat

dilihat bagaimana persebaran data antara set data penjualan dan promosi pada

periode tahun 1991-2004.

Tabel 1 Data Penjualan dan Promosi Tahun 1991-2004


Promosi Penjualan
Tahun (Rp juta) (juta unit)
Tahun 1991 100 10
Tahun 1992 150 15
Tahun 1993 170 18
Tahun 1994 200 20
Tahun 1995 250 25
Tahun 1996 300 30
Tahun 1997 350 35
Tahun 1998 380 38
Tahun 1999 340 36
Tahun 2000 400 42
Tahun 2001 420 43
Tahun 2002 450 46
Tahun 2003 450 46

Tahun 2004 450 46

Scatter Diagram Antara Penjualan dan Promosi

Hubungan Penjualan dan


Promosi

60
Penjualan

40
Series1
20
0
0 200 400 600
Promosi

Berdasarkan persebaran data tersebut, hubungan antara penjualan dan promosi

bisa dikatakan linier tetapi tidak exact linier karena ada beberapa data yang

tidak tepat di dalam garis. Untuk membuat sebuah garis hanya dibutuhkan dua

titik. Dan ternyata tidak semua titik berada pada garis tersebut.

5
Dalam konteks hubungan penjualan dan promosi, yang perlu diingat adalah promosi

bukanlah satu-satunya variabel yang mempengaruhi penjualan meskipun promosi

cukup dominan dalam mempengaruhi penjualan. Oleh karena itu, untuk

mengakomodir variabel lain sebenarnya cukup mempengaruhi penjualan akan

tetapi tidak dinyatakan secara eksplisit dalam model digunakan variabel u.

Sehingga hubungan antara penjualan dan promosi dapat dinyatakan dengan

y = β1 + β 2 x + u .......

(2)

Dimana u disebut dengan random error term atau lebih sering disebut dengan

error term. Error inilah yang membedakan antara ekonometrik dengan

persamaan matematik pada umumnya. Persamaan (1.2) di atas disebut sebagai

persamaan ekonometrik atau model regresi linier.

4. Pengumpulan Data

Salah satu hal penting dalam prosedur ekonometrik adalah pengumpulan data.

Econometrician harus menentukan data yang tepat berdasarkan model yang sudah

ditentukan, bagaimana karakteristik data yang dipilih sesuai dengan kebutuhan

analisis yang akan dibuat. Ada beberapa jenis data yang lazim digunakan untuk

analisis empiris, yaitu:

• Time Series

Time Series adalah data dari suatu variabel yang dikumpulkan

berdasarkan periode waktu. Seperti, data jumlah uang yang beredar,

tingkat suku bunga, jumlah pengangguran, jumlah angkatan kerja dan

sebagainya.

• Cross-Section

Cross-Section adalah data dari satu atau lebih variabel yang dikumpulkan

pada titik waktu tertentu. Seperti, data tingkat penjualan dan promosi

mobil “Atoz” pada tahun 2004 di lima dealer di Jakarta.

• Pooled

Pooled merupakan gabungan antara time series dan cross-section.

Seperti, data tingkat penjualan dan promosi mobil “Atoz” pada tahun

2000-2004 di lima dealer di Jakarta.

6
5. Estimasi Parameter

Dengan menggunakan set data penjualan dan promosi, dapat dilakukan estimasi

parameter β1 dan β 2 . Hubungan antara penjualan dan promosi dapat dinyatakan


sebagai berikut:

y = -0.321 + 0.103* x

Dari persamaan tersebut diketahui parameter β1 = −0.321 dan β 2 = 0.103 .


Artinya, penjualan akan negatif atau ayam tidak terjual apabila perusahaan tidak

melakukan promosi. Sedangkan bila perusahaan melakukan promosi sebesar satu

satuan, maka perubahan penjualan akan sebesar 0.103.

6. Pengujian Hipotesa

Berdasarkan hasil pengolahan data empiris di atas, econometrician ingin meng-

confirm antara hasil empiris dengan teori ekonomi yang berlaku, bagaimana peran

promosi terhadap penjualan. Bagaimana dengan intersep yang negatif? Bagaimana

dengan nilai koefisien promosi yang nilainya ternyata sangat kecil? Bagaimana

relevansi hasil pengujian dengan teori yang berlaku? Kesemuanya itu harus

dipikirkan oleh econometrician untuk menghasilkan analisis yang tepat.

7. Peramalan

Dalam konteks peramalan, econometrician dapat memprediksi besarnya penjualan

dengan memasukkan berbagai skenario alokasi promosi. Sehingga dapat dibuat

estimasi hasil penjualan berdasarkan skenario promosi yang dibuat.

1.3 Model Regresi Linier Sederhana (Ordinary Least Square): Kerangka Dasar

Model regresi linier sederhana melihat hubungan antara dua variabel. Salah satu variabel

menjadi variabel independen dan yang lain menjadi variabel dependen. Hubungan antara

dua variabel tersebut dapat dilihat secara visual melalui plot dari pasangan data untuk

variabel yang diteliti atau sering dikenal dengan scatterplot. Biasanya pasangan data

tersebut tidak selalu tepat sama (exactly) dengan garis lurus yang menunjukkan

hubungan antara promosi dan penjualan. Persebaran data di seputar garis lurus tersebut

7
lebih mencerminkan kecenderungan lemah atau kuatnya hubungan antara promosi dan

penjualan. Garis lurus mencerminkan hubungan antara dua variabel secara rata-rata.

Gambar 1 Berbagai Variasi Plot Data

Y
Y
Y

X 0 X X
Y

Y
X X X

Ketika pemetaan masalah sudah dilakukan (hubungan antara promosi dan penjualan),

selanjutnya perlu dibangun model yang menyatakan hubungan tersebut. Dalam hal ini

adalah model regresi sederhana. Komponen pembentukan model mencakup:

(i) Data

Data dibutuhkan untuk melihat persebaran dari pasangan dua variabel

terhadap garis lurus.

(ii) Model Statistik

Model Statistik dibutuhkan karena hubungan antara promosi dan penjualan

tidak selalu tepat sama pada garis lurus, atau persebaran data lebih

menunjukkan kuat atau lemahnya hubungan antara dua variabel. Sehingga

model statistik sangat berguna untuk menganalisis jenis hubungan tersebut.

(iii) Komponen sistematik dan random error.

Model Statistik memisahkan dari komponen sistematik dari komponen random

Dalam hal ini, perlu diketahui perbedaan komponen sistematik pada ANOVA dan regresi.

Pada ANOVA, komponen sistematik adalah variasi rata-rata antara sampel atau

tratment, dan komponen random adalah variasi yang tidak bisa dijelaskan. Sedangkan

pada regresi, komponen sistematik adalah keseluruhan hubungan linier dan komponen

random adlaah variasi diseputar garis lurus.

8
Sebagai contoh dari model regresi sederhana adalah hubungan antara promosi dan

tingkat penjualan. Variabel promosi diperlakukan sebagai variabel independen dan diplot

pada sumbu x. Sedangkan variabel penjualan diperlakukan sebagai variabel dependen dan

diletakkan pada sumbu y. Pada umumnya penentuan status suatu variabel, apakah sebagai

variabel dependen atau independen tergantung dari teori yang berlaku. Untuk kasus dua

variabel di atas, berdasarkan teori pemasaran dapat diketahui bahwa promosi

mempengaruhi penjualan. Variabel yang menentukan/mempengaruhi tersebut dijadikan

variabel independen, sedangkan variabel yang ditentukan/dipengaruhi dijadikan variabel

dependen.

Untuk kasus regresi sederhana, yang dilihat adalah hubungan antara dua variabel.

Sedangkan untuk lebih dari dua variabel, dikenal dengan istilah regresi berganda.

Berikut ini adalah Model Regresi Linier Sederhana dari populasi.

Y= β0 + β1 X + ε

Non-random Random komponen

Atau komponen

sistematik

Variabel y menunjukkan variabel dependen (variabel yang ingin diprediksi), variabel x

adalah variabel yang digunakan untuk memprediksi atau dikenal juga dengan variabel

independen atau variabel prediksi, ε adalah error term, satu-satunya komponen random

dalam model dan selanjutnya merupakan sumber kerandoman dalam y.

β0 adalah intersep dari komponen sistematik dalam hubungan regresi dan β1 adalah slope

dari komponen sistematik. Rata-rata (conditional mean) y dapat dihitung dengan rumus

berikut:

E [Y X ] = β 0 + β1 X

9
Gambar 2 Model Regresi Linier Sederhana

Y
Regression Plot

E[Y]=β0 + β1 X
Yi

{
Error: εi } β1 = Slope

}
1

β0 = Intercept

X
Xi

Model Regresi Linier Sederhana menunjukkan hubungan yang tepat sama (exact) antara

nilai rata-rata variabel dependen dan independen. Atau dapat dirumuskan:

E[Yi] = β0 + β1 Xi

Perbedaan antara nilai riil dan nilai ekspektasi dari y dijelaskan dalam random error.

Secara matematis dirumuskan sebagai berikut:

Yi = E[Yi] + εi

= β0 + β1 Xi + εi

Model Regresi Linier Sederhana memiliki beberapa asumsi dasar yang harus dipenuhi

untuk menghasilkan estimasi yang baik atau dikenal dengan BLUE ( Best Linier Unbiased

Estimator). Asumsi-asumsi dasar tersebut mencakup homoskedastik, no-multicollinearity

dan no-autocorrelation.

Selanjutnya, yang perlu diketahui adalah, dalam konteks pendugaan koefisien regresi

sampel, secara umum, metode OLS sudah diterima sebagai suatu kriteria yang baik. Tidak

dibutuhkan asumsi-asumsi lebih lanjut. Akan tetapi, dalam konteks inferensi regresi,

yaitu dalam pembuatan pendugaan interval dan pengujian parameter regresi populasi,

dibutuhkan asumsi-asumsi berikut:

1. Model regresi adalah linier dalam parameter.

2. Variabel bebas memiliki nilai yang tetap untuk sampel yang berulang (bersifat
nonstokastik). Implikasinya, variabel bebas tidak berhubungan dengan error

term. Atau kovarian antara variabel bebas dan error term dinyatakan dengan

10
(u i , X i ) =∈ [ X i − ∈ ( X i )][u i − ∈ (u i )] = 0

3. Berkaitan dengan error term, ada beberapa persyaratan sebagai berikut:


a. Error term memiliki rata-rata sama dengan nol dan varian konstan

(homoscedasticity) untuk setiap nilai Xi. Sehingga dapat dinyatakan

∈ (u i X i ) = 0 dan Var (u i X i ) = σ 2

b. Error term pada suatu observasi tidak berhubungan dengan error


term pada observasi lain (no-autocorrelation).

c. Error term (u) memiliki distribusi normal. Implikasinya, Y dan


distribusi sampling koefisien regresi memiliki distribusi normal.

Gambar 3 Error yang bersifat Homoskedastik

Assumptions of the Simple


Y Linear Regression Model

E[Y]=β0 + β1 X

Identical normal
distributions of errors,
all centered on the
regression line.

Hasil estimasi OLS sering disebut dengan istilah BLUE (Best Linier Unbiased

Estimator). Sederhananya, hasil estimasi yang bersifat BLUE adalah:

1. Efisien, artinya hasil nilai estimasi memiliki varian yang minimum dan tidak

bias.

2. Tidak bias, artinya hasil nilai estimasi sesuai dengan nilai parameter.

3. Konsisten, artinya jika ukuran sampel ditambah tanpa batas maka hasil nilai

estimasi akan mendekati parameter populasi yang sebenarnya.

11
Apabila asumsi normalitas terpenuhi (syarat 3c) dimana error terdistribusi

secara normal dengan rata-rata sama dengan nol dan standar deviasi konstan atau

singkatnya dinyatakan dengan u ~ N (0, σ 2 ) , maka

4. Intersep (a) akan memiliki distribusi normal atau a ~ N ( A, σ a2 ) .

5. Koefisien regresi akan memiliki distribusi normal atau b ~ N ( B, σ b2 ) .


Dalam hal ini, asumsi normalitas sangat penting untuk penyederhanaan dalam

melakukan pendugaan interval dan pengujian hipotesis secara statistik.

Estimasi dari model regresi sederhana bertujuan untuk mendapatkan nilai intersep dan

slope dari garis regresi linier. Secara matematis dinyatakan:

Y=b0 + b1X + e

Keterangan:

b0 adalah estimasi untuk intersep garis regresi populasi, atau dinotasikan dengan β0

b1 adalah estimasi slope garis regresi populasi, atau dinotasikan dengan β1

e adalah observed errors – residu antara garis regresi populasi b0 + b1X dengan titik-

titik observasi.

Estimasi garis regresi:

Yˆ = b0 + b1 X

Ŷ menunjukkan nilai Y yang terletak pada “fitted” regression line untuk berbagai nilai X.

Y Y
Gambar 4 Fitting a Regression Line

Data
Three errors from the
least squares regression
X line X
Y e

Three errors 12
Errors from the least
from a fitted line squares regression
line are minimized
X X
Metode estimasi yang sering digunakan untuk mengestimasi fungsi regresi populasi

dari fungsi regresi sampel adalah metode OLS. Kriteria dari OLS adalah "line of best

fit" atau dengan kata lain, jumlah kuadrat dari deviasi antara titik-titik observasi

dengan garis regresi adalah minimum. "Line of best fit" adalah garis yang memiliki

∑e² paling kecil. Berkaitan dengan konteks kuadarat error yang minimum, best

fitting line disebut dengan least square line. Least square line dapat ditentukan

dengan menghitung set observasi (x,y) data. Perhitungan tersebut menghasilkan nilai

b0 dan b1. Selanjutnya, nilai tersebut disubstitusikan ke dalam persamaan



Y = b0 + b1 X untuk memperoleh persamaan garis regresi least square.

Sederhananya, prosedur yang meminimumkan kuadrat error terkecil dapat dijelaskan

sebagai berikut:

1. Persamaan garis regresi sampel



Yi = b0 + b1 X i

2. Bentuk stokastik dari persamaan regresi sampel

Yi = b0 + b1 X i + ei
Dengan memasukkan persamaan pada point (1) di atas diperoleh

Yi = Yi + ei

Jadi nilai error dapat dinyatakan dengan



ei = Yi − Yi
Errors in Regression
Gambar 5 Error dalam Regresi

Yi . Y = b0 + b1 X the fitted regression line

Yi
{
Error ei = Yi − Yi
Yi the predicted value of Y for X
i

13
X
Dari beberapa persamaan di atas dapat disimpulkan bahwa garis regresi sampel

yang paling mendekati garis regresi populasi adalah yang meminimumkan kuadrat

error. Kuadrat error minimum dapat dinyatakan dengan:

1. ∑ ei2

2. ∑(Yi − Yi ) 2

3. ∑(Yi − b0 − b1 X i ) 2


Untuk Y = b0 + b1 X , nilai b0 dan b1 diperoleh berdasarkan rumus:

n(ΣXY ) − (ΣX )(ΣY )


b1 =
n(ΣX 2 ) − (ΣX ) 2

ΣY − b1 (ΣX )
b0 =
n

dimana n adalah jumlah data atau banyaknya observasi. Rumus di atas akan menjadi

lebih sederhana jika variabelnya dinyatakan dalam bentuk deviasi standar terhadap

rata-rata sampel.

Jika x=X −X
y = Y −Y
maka rumus a dan b dapat dinyatakan dengan

Σxy
b1 = dan b0 = Y − b1 X
Σx 2

Karakteristik garis regresi sampel adalah:

14
1. Garis regresi sampel akan melalui X dan Y yang merupakan rata-rata dari
variabel X dan Y yang diperoleh dari sampel.

2. Nilai residu akan memiliki rata-rata sama dengan 0 karena ∑ ei = 0

Berikut ini adalah contoh data dua variabel, x dan y, untuk dijadikan latihan dalam

mencari nilai b0 dan b1 dari suatu persamaan regresi.

Contoh 1

x y x2 xy

1211 1802 1466521 2182222

1345 2405 1809025 3234725

1422 2005 2022084 2851110

1687 2511 2845969 4236057

1849 2332 3418801 4311868

2026 2305 4104676 4669930

2133 3016 4549689 6433128

2253 3385 5076009 7626405

2400 3090 5760000 7416000

2468 3694 6091024 9116792

2699 3371 7284601 9098329

2806 3998 7873636 11218388

3082 3555 9498724 10956510

3209 4692 10297681 15056628

3466 4244 12013156 14709704

3643 5298 13271449 19300614

3852 4801 14837904 18493452

4033 5147 16265089 20757852

4267 5738 18207288 24484046

4498 6420 20232004 28877160

4533 6059 20548088 27465448

4804 6426 23078416 30870504

5090 6321 25908100 32173890

5233 7026 27384288 36767056

15
5439 6964 29582720 37877196

79498 10605 293426944 390185024

Jawab:

Rumus dari sum of square and cross products adalah:

(∑ x) 2
SS x = ∑( x − x ) = ∑ x −
2 2

n
(∑ y ) 2
SS y = ∑( y − y ) 2 = ∑ y 2 −
n
(∑ x)(∑ y )
SS xy = ∑( x − x )( y − y ) = ∑ xy −
n
Sedangkan rumus untuk least square regression estimator adalah:

SS XY
b1 =
SS X
b0 = y − b1 x

Untuk mencari nilai b0 dan b1 dapat dibuat prosedur pengerjaan sebagai rumus di atas:

2
2 ( ∑ x)
SS x = ∑ x −
n
2
79448
= 293426944 − = 40947552
25
( )
∑ x (∑ y)
SS xy = ∑ xy −
n
2
106605
= 390185024 − = 51402848
25
SS XY 51402848
b1 = = = 1.255333776 ≈ 1.26
SS X 40947552
106605  79448
− (1.255333776) 
b0 = y − b1 x = 
25  25 
= 274 .85

16
Analisis Regresi dari kasus di atas adalah:

Persamaan garis regresi

y = 275 + 1.26 x

Predictor Coef Stdev t-ratio p

Constant 274.8 170.3 1.61 0.120

X 1.25533 0.04972 25.25 0.000

s = 318.2 R-sq = 96.5% R-sq(adj) = 96.4%

Analysis of Variance

SOURCE DF SS MS F p

Regression 1 64527736 64527736 637.47 0.000

Error 23 2328161 101224

Total 24 66855896

Selanjutnya dibahas Error Variance dan the Standard Errors of Regression Estimators.

Perlu diperhatikan, sebelum melakukan pengerjaan lebih lanjut, pertama kali harus

ditentukan derajat kebebasan (degree of freedom). Dalam hal ini, derajat kebebasan

sebesar df = (n-2)

Keterangan:

n menunjukkan total observasi dikurangi dengan derajat kebebasan untuk setiap

parameter yang diestimasi, yaitu b0 dan b1.

( SS XY ) 2
SSE = ∑( y − y ) = SS y −
2

SS X
SSE = SS Y − b1 SS XY
Estimator yang tidak bias (unbiased estimator) dari s2 ditunjukkan pada rumus berikut:

SSE
MSE =
n−2

Berdasarkan contoh di atas, bisa dicari nilai dari SSE sebagai berikut:

17
SSE = SS Y − b1 SS XY
SSE = 66855898 − (1.255333776)(51402852.4)
SSE = 2328161.2
SSE 2328161.2
MSE = =
n−2 23
MSE = 101224.4
S = MSE
S = 101284.4
S = 318.158

Standar Error estimasi regresi dari soal di atas dapat diselesaikan dengan rumus

berikut:

1. Standar error dari intersep atau b0

s ∑ x2
s (b0) =
nSS x
s = MSE

2. Standar error dari slope atau b1

s
s (b1) =
SS X

Masih merujuk soal di atas, dapat dicari standar error dari b0 dan b1 sebagai berikut:

1. Standar error dari intersep, b0

s ∑ x2
s (b0) =
nSS x
318.158 293426944
s (b0) = = 170.338
(25)(4097557.84)

2. Standar error dari slope, b1

s
s (b1) =
SS X
318.158
s (b1) = = 0.04972
409

18
Interval keyakinan dari parameter regresi dirumuskan sebagai berikut:

A (1 - α ) 100% confidence interval for b 0 :


b ± t α s (b )
0  ,(n− 2 ) 0
2 

A (1 - α ) 100% confidence interval for b :


1
b1 ± t α s (b )
 ,(n− 2 )
 1
2 

Mengacu pada soal di atas, nilai dari tingkat kepercayaan 95% adalah:

1. Interval kepercayaan (confidence interval) untuk intersep, b0 adalah

b0 ± t ( 0.025,( 25−2 )) s (b0)


= 274.85 ± (2.069)(170.338)
= 274.85 ± 352.43
= (−77.58;627.28)

2. Interval kepercayaan (confidence interval) untuk slope, b1 adalah:

b1 ± t( 0.025,( 25−2 )) s(b1)


= 1.25533 ± (2.069)(0.04972)
= 1.25533 ± 0.10287
= (1.15246;1.35820)

1.4 Analisis Korelasi dan Kovarian

Salah satu topik penting yang perlu dipahami, yaitu analisis korelasi. Sederhananya,

analisis korelasi adalah suatu alat statistik untuk menunjukkan seberapa besar tingkat

(degree) hubungan suatu variabel secara “linier” terhadap variabel lain. Korelasi itu

sendiri menyatakan tingkat hubungan atau keterkaiatan antara dua variabel. Seringkali

analisis korelasi ini digunakan secara bersama-sama dengan analisis regresi untuk

mengukur seberapa tepat garis regresi mampu menjelaskan variasi variabel dependen.

Ada dua ukuran yang mencerminkan korelasi antara dua variabel, yaitu: koefisien

determinasi dan koefisien korelasi. Koefisien determinasi digunakan untuk mengukur

kesesuaian model, atau dinotasikan dengan R2. Indikator ini menyatakan seberapa besar

variasi dari variabel bebas (X) mampu menjelaskan perubahan variabel terikat (Y).

19
Sedangkan untuk koefisien korelasi, dalam hal ini korelasi populasi, dinotasikan dengan p,

memiliki nilai dari -1 ke 1. Ada beberapa ragam nilai korelasi yang menunjukkan

karakteristik hubungan antara dua variabel, yaitu:

• ρ=-1 menunjukkan hubungan linier negative sempurna (perfect negative linear

relationship)

• -1< ρ <0 menunjukkan hubungan linier negative (negative linear relationship)

• ρ=0 menunjukkan tidak ada hubungan linier

• 0< ρ <1 menunjukkan hubungan linier positif (positive linear relationship)

• ρ=1 menunjukkan hubungan linier positif sempurna (perfect positive linear

relationship)

Nilai absolute dari p menunjukkan kekuatan atau ketepatan suatu hubungan.

Gambar 6 Berbagai Jenis Korelasi Dua Variabel

Y ρ=- Y ρ= Y ρ=
1 0 1

X X X

Y ρ=- Y ρ= Y ρ=.
.8 0 8

X X X

Kovarian dan Korelasi

1. Kovarian dari dua variabel random X dan Y adalah :

Cov ( X , Y ) = E[( X − π X )(Y − π Y )]

Untuk π X dan π Y adalah rata-rata populasi.


2. Koefisien korelasi populasi dirumuskan dengan:

Cov ( X , Y )
ρ=
σ XσY
Sedangkan untuk koefisien korelasi sample dirumuskan dengan:

20
SS XY
r=
SS X SS Y

Merujuk soal di atas, bisa dicari koefisien korelasi sampel sebagai berikut:

SS XY
r=
SS X SS Y
51402852.4 51402852.4
r= = = 0.982
( 409475578)(6655589) 5232191.2

Selanjutnya, pembahasan tentang berbagai uji dalam regresi sederhana akan dibahas

pada modul 3. Modul 2 lebih menekankan uji hipotesis dan confidence interval dari

perspektif teoritis. Hal ini bertujuan agar filosofi dasar dari uji hipotesis dapat dipahami

dengan baik.

21

Anda mungkin juga menyukai