MAKASSAR
2019
1
DAFTAR ISI
Pengantar ................................................................................................................. 6
2
BAB V REGRESI LINEAR BERGANDA
3
9.1. Pendahuluan ..................................................................................................... 213
9.2. Linear Probability ............................................................................................ 214
9.3. Model Logit ..................................................................................................... 217
9.3.1. Estimasi parameter dari Model Logit .................................................. 228
9.3.2. Penjelasan Koefisien Model ................................................................... 229
9.3.3. Uji Kesesuaian Model ............................................................................ 230
9.3.4. Contoh Estimasi Model Logit ................................................................. 231
4
13.5. Masalah Identifikasi ........................................................................................ 310
13.5.1. Kondisi Identifikasi ............................................................................... 311
13.5.2. Kondisi Rank ........................................................................................ 313
13.5. Estimasi Persamaan Simultan ........................................................................ 316
13.5.1. Indirect Least Squares (ILS) ................................................................. 317
13.5.2. Two State Least Squares (2SLS) ......................................................... 321
13.5.3. Three State Least Squares (3SLS) ..................................................... 321
13.6. Soal ................................................................................................................ 331
5
KATA PENGANTAR
BISMILLAHIRROHMANIRROHIM
Salah satu perbedaan dari buku-buku lainnya adalah buku ini menyajikan
Analisis Korelasi Kanonik, suatu jenis korelasi yang jarang didapat
dalam buku-buku ekonometrika lainnya. Selain dari pada Regresi
dengan varaibel dummy juga dibahas secara rinci baik dari segi teori
maupun dari aplikasinya dengan berbagai contoh yang menarik.
6
BAB I
KONSEP DASAR EKONOMETRIKA
7
mengenai perilaku suatu variabel sepanjang beberapa waktu berturut-turut,
berbeda dengan analisis antar-wilayah yang menjelaskan antara beberapa
daerah dalam satu waktu tertentu (snapshot). Sementara itu analisis data
panel menggabungkan antara data runtun waktu dengan data antar-wilayah.
Dalam definisi yang sederhana, ekonometri adalah suatu aplikasi dari
metode statistika pada ekonomi. Namun, tidak seperti pada ilmu statistika,
yang hanya terfokus kepada data statistik, ilmu ekonometri merupakan
gabungan dari teori ekonomi, matematika, dan statistika. Istilah ekonometri
pertama kali diperkenalkan oleh Ragnar Frisch (1933), seorang pakar
ekonomi dan statistika berkebangsaan Norwegia. Ia menjelaskan definisi
ekonometri sebagai berikut: “Terdapat banyak metode kuantitatif sewaktu
menganalisis ilmu ekonomi, tetapi tiada satu pun di antara metode
kuantitatif tersebut dapat berdiri sendiri tanpa bantuan dari yang lain untuk
menerangkan ekonometri. Oleh karena itu, ketiga faktor yaitu teori
ekonomi, matematika dan statistika sama-sama penting untuk menerangkan
hubungan kuantitatif dalam mempelajari ilmu ekonomi.
Definisi Ekonometrika
8
diharapkan akan dapat meningkatkan kuantitas komoditi yang diminta. Jadi
menurut hukum ekonomi terjadi hubungan yang terbalik antara harga dan
kuantitas komoditi yang diminta. Akan tetapi, teori ekonomi sendiri tidak
menyajikan pengukuran numerik, sampai seberapa jauh kuantitas suatu
komoditi akan meningkat atau menurun karena perubahan harganya.
Fenomena tersebut di muka adalah tugas ekonometrika untuk menentukan
nilai dan duga numeriknya. Haruslah dapat dibedakan antara ekonometrika
yang berisikan hasil empirik dengan teori ekonomi secara umum.
Peranan utama dari matematika ekonomi adalah mengekspresikan
teori ekonomi dalam bentuk matematika seperti persamaan, tanpa
memandang verifikasi pengukuran dan empirik dari teorinya. Seperti yang
akan diuraikan, bahwa ekonometrika sering menggunakan persamaan
matematika yang diajukan para ahli matematika ekonomi, tetapi bentuk
tersebut selanjutnya harus diuji secara empiris. Konversi dari matematika ke
dalam persamaan ekonometrika menghendaki kejujuran ilmiah dan
keterampilan praktis dalam memaknainya. Statistika ekonomi menyangkut
tentang pengumpulan, pengolahan, dan pengujian data ekonomi dalam
bentuk grafik atau tabel. Tugas ini merupakan bagian dari para ahli statistika
ekonomi. Akan tetapi, para ahli statistika ekonomi tidaklah bertindak lebih
jauh dengan mengumpulkan data tersebut untuk menguji teori ekonomi, dan
tentu saja bagian tersebut harus merupakan tugas para ekonometrikan.
Walaupun demikian matematika-statistika menyajikan banyak alat yang
dapat dipergunakan dalam perdagangan. Para ekonometrikan seringkali
menghendaki metode tertentu dalam membahas data ekonomi yang unik,
misalkan karena data yang dihasilkan tidak merupakan hasil penelitian yang
terkontrol. Ekonometrikan, seperti juga ahli klimatologi umumnya
bergantung pada data yang tidak dapat dikontrol secara langsung. Misalnya
data konsumsi, pendapatan, investasi, tabungan, harga, dan sebagainya,
yang dikumpulkan dari masyarakat atau dan perusahaan swasta merupakan
data yang bukan hasil percobaan atau eksperimen. Ekonometrikan
mengambil data tersebut dari apa yang telah tersedia. Data tersebut
menimbulkan masalah yang secara normal tidak berasal dari matematika-
statistika ekonomi. Selanjutnya, data yang dikumpulkan mungkin
mengandung kekeliruan atau kesalahan dalam pengukurannya dan
ekonometrikan dituntut untuk mengembangkan metode tertentu untuk
menganalisis kekeliruan pengukuran tersebut.
9
berdasarkan atas teori ekonomi. Selain Pareto, Marie-Esprit-Léon Walras
dari Perancis pada abad ke-18 mengembangkan teori keseimbangan umum
yang menjelaskan mengenai aliran barang dan jasa dalam perekonomian.
Pada awal tahun 1950-an ekonometri dikembangkan sebagai satu cabang
sendiri dari ilmu ekonomi. Jan Tinbergen dari Belanda, yang kini namanya
diabadikan sebagai salah satu institusi akademik besar di Eropa (Tinbergen
Institute), merupakan salah tokoh utama yang mengembangkan ilmu ini.
Saat ini ekonometri telah berkembang sedemikian pesat sehingga banyak
jurnal ilmiah yang didedikasikan untuk ilmu ini, seperti Econometrica,
Journal of Econometrics, Journal of Applied Econometrics, dan Journal of
the Operational Research. Penggunaan ekonometri telah sedemikian luas
sehingga hampir semua jurnal, tesis, disertasi, dan bahkan skripsi dalam
ilmu ekonomi memakai ekonometri sebagai salah satu alat yang digunakan.
Sementara itu dalam prakteknya, ekonometri terutama dipakai di bank
sentral, oleh tim ekonomi pemerintah untuk melakukan perencanaan dan
analisis kebijakan ekonomi, dan juga oleh dunia usaha untuk
mengoptimalkan kinerja perusahaan. Selain di bidang moneter, ekonometri
juga sudah banyak dipakai di berbagai bidang ekonomi yang lain dan juga
bisnis dan manajemen, seperti mikroekonomi, marketing, dan finance.
Di Indonesia, penerapan ekonometri masih terbatas dan pengembangan
ilmu ini hanya pada lembaga/universitas tertentu. Dua dari sedikit akademisi
di bidang ekonometri di Indonesia adalah Profesor Insukindro dari
Universitas Gadjah Mada terutama berkat penerapan ekonometri untuk
ekonomi moneter dan Dr. Ari Kuncoro dari Universitas Indonesia karena
pekerjaannya di bidang mikroekonometri. Selanjutnya tokoh yang
bersejarah dalam Ekonometrika:
a. Jan Tinbergen dan Ragnar Anton Kittil Frisch, mendapat Hadiah Nobel
Ekonomi tahun 1969 (tahun pertama Hadiah Nobel Ekonomi
diberikan) karena mengembangkan dan menerapkan model dinamik
untuk analisis ekonomi.
b. Lawrence Robert Klein, profesor ekonomi di University of
Pennsylvania, mendapat Nobel tahun 1980 berkat pekerjaannya di
pemodelan ekonomi melalui komputer.
c. Trygve Magnus Haavelmo dihadiahi hadial nobel pada tahun 1989.
Kontribusi utamanya pada artikel yang ditulisnya tahun 1944 di jurnal
Econometrica yang berjudul "The Probability Approach to
Econometrics"
d. Daniel Little McFadden dan James Joseph Heckman berbagai
penghargaan untuk tahun 2000 untuk pekerjaannya di bidang
mikroekonometri. McFadden mendirikan laboratorium ekonometri di
University of California, Berkeley, Amerika Serikat.
e. Robert Fry Engle dan Clive William John Granger pada tahun2003
karena kontribusi mereka pada pengembangan analisis runtun waktu.
Engle menjadi pionir metode autoregressive conditional
heteroskedasticity (ARCH) sedangkan Granger atas metode
kointegrasi.
10
1.3.Tujuan Ekonometrika
11
3. Menentukan model matematis dari teori tersebut;
4. Menentukan model statistic, atau ekonometri, dari teori tersebut;
5. Menaksir parameter-parameter dari model ekonometri yang dipilih;
6. Memeriksa kecocokan model: pengujian spesifikasi model;
7. Menguji hipotesis yang didasarkan dari model;
8. Menggunakan model untuk melakukan prediksi atau peramalan.
Membuat pernyataan teoritis atau hipotesis merupakan langkah awal
dalam metodologi ekonometrika, karena teori merupakan dasar atau
hipotesis yang akan diuji kebenarannya secara empiris. Dalam pelaksanaan
selanjutnya melakukan pengumpulan data di lapangan untuk menjelaskan,
membantah atau menerima teori teori yang akan diuji. Langkah selanjutnya
adalah pembuatan model matematis untuk meringkas atau
menyederhanakan konsep dari hipotesis yang akan diuji, sehingga
tergambar dengan jelas hubungan antara variabel, seperti hubungan antara
variabel bebas dan variabel tak bebas, misalnya menggunakan model
regresi. Langkah terakhir dalam analisis ekonometrika adalah melakukan
prediksi dari hasil pengujian yang diperoleh. Misalnya jika hipotesis
diterima maka dapat dikejutkan dengan prediksi, sebaliknya jika ditolak,
maka akan dilakukan perbaikan sebelum dilakukan prediksi.
12
Ekonometrika berbeda dengan matematika statistik dan statistik
ekonomi. Sebuah statistik ekonomi berperan dalam membangun data,
merekamnya, mentabulasinya atau menggambarkannya, yang
menggambarkan pola perkembangannya sepanjang waktu dan mungkin
mendeteksi beberapa hubungan antara berbagai besaran ekonomi. Statistik
ekonomi secara khusus menggambarkan aspek ekonomi. Statistik ekonomi
tidak menyajikan penjelasan dari perkembangan berbagai variabel dan tidak
menyajikan pengukuran dari parameter hubungan ekonomi. Ekonometrika
menggunakan metode statistika setelah menyesuaikannya dengan masalah
dari kehidupan ekonomi. Penyesuaian metode statistika ini disebut dengan
metode ekonometrika. Secara terpisah, metode ekonometrika diadjust
sehingga menjadi tepat untuk pengukuran hubungan ekonomi yang bersifat
stokastik yang mencakup elemen acak. Penyesuaian terkait secara utama
dalam menspesifikasi elemen acak itu yang dihadap dalam dunia nyata dan
masuk ke dalam penentuan data yang diamati, kemudian terakhir dapat
diinterpretasikan sebagai sampel acak yang mana metode statistika dapat
diterapkan.
13
Soal :
14
BAB II
KORELASI
2.1. Pendahuluan
Asumsi:
a. Data terdistribusi Normal
b. Variabel yang dihubungkan mempunyai hubungan linear
c. Variabel yang dihubungkan mempunyai data yang dipilih secara acak.
d. Variabel yang dihubungkan mempunyai pasangan yang sama dari subjek
yang sama pula (variasi skor variabel yang dihubungkan harus sama).
e. Variabel yang dihubungkan mempunyai data interval atau rasio.
Korelasi moment Produk Pearson (person Product Moment), dapat
dikatakan sebagai koefisien korelasi sederhana yang dinyatakan dengan r
dengan nilai antara -1 dan 1 atau -1 < r < +1, dapat direpresentasikan
sebagai hubungan asosiasi yang menyatakan kekuatan hubungan antara
15
dua variabel, misalkan X dan Y. Nilai positif (+) menunjukkan hubungan
korelasi yang bersifat positif dan nilai negatif (-) menunjukkan hubungan
yang bersifat negatif. Jika nilai korelasi r mendekati satu berarti
hubungan yang terjadi adalah sangat kuat dan jika sama persis dengan 1
maka terjadi hubungan sempurna antar dua variabel. Demikian juga terjadi
sebaliknya, pada saat bertanda negatif. Korelasi bertanda positif
menunjukkan hubungan antara dua variabel adalah searah, yakni jika satu
variabel mengalami kenaikan maka variabel lain juga mengalami kenaikan.
Sedangkan korelasi negatif menunjukkan arah yang berlawanan, yakni jika
satu variabel mengalami peningkatan maka variabel lainnya mengalami
penurunan. Nilai korelasi sama dengan 0 menunjukkan tidak adanya
hubungan dan mendekati nol berarti hubungan sangat lemah. Nilai-nilai
yang mendekati 0 bersifat acak, menujukkan hubungan tidak linear antara
dua variabel. Dapat dimengerti bahwa korelasi ini tidak memiliki satuan
(dimensionless), artinya tidak bergantung pada satuan.
Derajat korelasi menggambarkan tingkat hubungan antara dua
variabel. Korelasi sempurna ± 1 terjadi jika diagram pencar data membentuk
tepat satu garis lurus, artinya seluruh pasangan titik (x dan y) misalnya,
terletak persis pada garis lurus. Jika sama dengan 1 berarti kemiringan
garis sama dengan satu dan jika sama dengan -1 berarti memiliki
kemiringan sama dengan -1. Selanjutnya jika korelasi di 0,8 dikatakan
memiliki hubungan sangat kuat dan jika lebih kecil dari pada 0,5 umumnya
keeratan hubungan dipandang lemah, lebih jelasnya dapat dilihat pada
Gambar 2.1. Gambar a dan b menunjukkan korelasi sempurna, karena
nilai r = -1 dan r = 1. Gambar a menunjukkan arah yang berlawanan
sementara b) memiliki hubungan yang searah.
Memplotkan pasangan sampel data tersebut pada diagram kartesian
yang disebut dengan scatter plot atau diagram pencar. Setiap pasangan data
(x, y) diplotkan sebagai titik tunggal. Manfaat langsung yang diperoleh
dengan menggunakan diagram tersebut adalah menggambarkan hubungan
secara sederhana dan non matematis dimana ukuran tidak dipengaruhi oleh
besarnya unit.
16
a) b) c)
x x x
r = -1 r=1 r=0
y y y
d) e)
x x
r=0 r 0,6
y y
Hubungan yang tidak linear
x f) g) x x c)
y y y
Gambar 2.1. Nilai-nilai korelasi pada bidang XY
Pada gambar 2.1 juga terlihat hubungan arah yang ditunjukkan atau
dinyatakan dengan nilai positif dan nilai negatif. Tanda positif berarti
memiliki hubungan yang searah, seperti hubungan antara harga dan
penawaran sedang negatif berarti memiliki hubungan yang berlawanan,
seperti hubungan antara harga dengan permintaan. Jadi pada gambar 2.1.f,
misalnya jika x naik maka juga y juga naik dan pada gambar dan pada
gambar 2.1,f misalnya, jika X tersebut naik maka Y menurun dan terjadi
sebaliknya. Selanjutnya gambar yang tidak memiliki arah, seperti gambar
2.1.c, berarti bubungan tersebut bernilai nol (tidak ada hubungan atau bebas
sama sekali antara x dan y) dan tidak memiliki arah atau memilki arah yang
tak terhingga banyaknya.
17
Angka korelasi dipandang sebagai harga mutlak, yaitu jika minus
hanya menunjukkan arah yang berlawanan, sehingga dapat ditulis:
Ada berbagai jenis korelasi yang ada dalam statistika, ditinjau dari segi
jumlah atau banyaknya variabel yang dimasukkan dalam model, maka
korelasi dapat dikelompokkan menjadi dua bagian utama. Pertama korelasi
dikelompokkan berdasarkan jenis variabel yang digunakan
1. Korelasi bivariat
2. Korelasi ganda
3. Korelasi parsial
4. Korelasi kanonikal
18
ukuran populasinya yang biasa digunakan adalah sedang untuk sampel
ditulis rs , namun demikian yang sering digunakan adalah .
6 di2
1
n(n 2 1)
Where:
Contoh:
1 2 3 4 5 6 7 8 9
X 1 4 3 4 5 6 7 8 9
Y 2 2 5 4 5 6 8 8 7
No X Y Rank Rank
d d2
X
Y
1 1 1 9 9 0 0
2 2 3 8 7 1 1
3 3 2 7 8 1 1
6 6 6 4 4 0 0
19
7 7 8 3 2.5 0.5 0.25
9 9 9 1 1 0 0
Jumlah 5
d i
2
5
6(5) 30 30
1 ; 1 ; 1 0,96
9(9 2 1) 720 720
20
nc nd
n
( n 1)
2
Where:
Bersesuaian (C); jika (xi > xj dan yi > yj) atau (xi < xj dan yi <
yj)
Tidak bersesuaian (D); jika (xi > xj dan yi < yj) atau (xi < xj dan yi >
yj)
contoh:
1 2 3 4 5 6 7 8 9
X 1 4 3 4 5 6 7 8 9
Y 2 2 5 4 5 6 8 8 7
1 1 1 9 9 1 1
2 2 3 8 7 2 2.5
3 3 2 7 8 3 2.5
4 4 4 4.5 6 4 4
21
5 4 5 4.5 5 4.5 5
6 6 6 4 4 4.5 6
7 7 8 3 2.5 7 8
8 8 8 2 2.5 8 7
9 9 9 1 1 9 9
Tabel 2.2 . Menghitung jumlah yang bersesuaian (C) dan tidak Bersesuaian (D)
1 2 3 4 5 6 7 8 9
1 C D
2 + 1
3 + 1 0
4 + + + 3
4.5 + + + 3 0
4.5 + + + + + 5
7 + + + + + + 6
8 + + + + + + + 7
9 + + + + + + + + 8
Jumlah 34 0
nc nd 34 0 34
; 0,94
n 9 36
(n 1) (9 1)
2 2
22
2.2.3. Korelasi Biserial Titik
M1 M 0
rpbi pq
sn
Dimana:
p = proporsi kelompok 0
Korelasi biserial
23
sampelnya memiliki ukuran dikotomis. Misalnya, hubungan pendapatan dan
gender, hubungan antara IQ dengan dengan kelulusan dan sebagainya.
M1 M 0
rb pq
Zs y
Dimana:
p = proporsi kelompok 0
q = proporsi kelompok 1 (1-p)
2.2.5.Korelasi Ganda
24
dengan modal dan tenaga kerja. Korelasi ini akan dibahas secara rinci pada
Bab yang membahas regresi liner berganda.
rYX 2
X2
Y
rX 1 X 2
X1
25
ryx2 .x1 adalah korelasi antara y dan x2 dimana x1 dikendalikan.
rp n 3
t ……..(2.8)
1 rp2
Dimana:
Selain dari pada itu, korelasi dapat dilihat dari bentuk hubungan
antara variabel. Dalam hal terdapat tiga macam bentuk hubungan antar
variabel, yaitu hubungan simetris, hubungan sebab akibat (kausal) dan
hubungan interaktif (saling mempengaruhi).
26
a. Product Moment Pearson : Kedua variabelnya minimal berskala
interval
b. Rank Spearman : Kedua variabelnya berskala ordinal
c. Point Serial : Satu berskala nominal sebenarnya dan satu berskala
interval
d. Biserial : Satu berskala nominal buatan dan satu berskala interval
e. Koefisien kontingensi : Kedua variabelnya berskala nominal
Berbagai jenis korelasi yang telah disebutkan dapat digunakan sesuai
topik dan masalah penelitian yang akan dipecahkan dalam berbagai bidang
ilmu atau aktivitas ekonomi, yang dapat digunakan sebagai salah satu alat
dalam menentukan kebijakan bisnis atau lainnya.
27
Obs Variabel variabel Deviasi
eva
si Respons (Y) Prediktor (X) Y x
1 Y1 X1 Y1 Y X1 X
2 Y2 X2 Y2 Y X2 X
. .
. .
. .
n Yn Xn Yn Y Xn X
Dimana :
n n
Y i X i
Y i 1
dan X i 1
merupakan rata-rata sampel dari masing-
n n
masing populasi Y dan X.
(x i x )( yi y )
Cov( X , Y ) i 1
n 1
28
Cov( X , Y )
r( X ,Y )
S X SY
Sx
( X i X )2
n 1
Cov( X , Y )
rXY
n 1
Atau
(X i X )(Yi Y )
Cov( X , Y ) i 1
n 1
( X Y X Y Y X XY )
i i i i
i 1
n 1
29
n n n
X iYi Y X i X Yi nXY )
i 1 i 1 i 1
n 1
X Y nXY i i
Cov( X , Y ) i 1
n 1
(X i X )(Yi Y )
r i 1
n n
(X
i 1
i X ) 2 (Y j Y ) 2
j 1
Atau
n n n
n X iYi X i Yi
r i 1 i 1 i 1
…. (2.9)
n n n n
[n X i ( X i ) ][n Yi ( Yi ) ]
2 2 2 2
i 1 i 1 i 1 i 1
30
n
x y i i
r i 1
…. (2.10)
n n
x y
i 1
2
i
i 1
2
i
Dimana:
xi X i X
yi Yi Y
Hipotesis statistik
H0 : 0
H1 : 0
r n2 (2.10)
t
1 r2
Hipotesis:
31
H1 : Terdapat hubungan antara kecelakaan dan kendaraan bermotor
Nilai t hitung ini akan dibandingkan dengan t tabel pada tingkat kesalahan
α atau pada taraf signifikansi (1-α) . Biasanya diambil α = 0,05.
Kriteria pengujian:
Ho ditolak jika nilai t hitung lebih besar dari pada t tabel dengan
derajat bebas atau degree of freedom (df) n-2, demikian pula
sebaliknya.
Contoh:
X Y XY X^2 Y^2
Ditanyakan:
32
Jawab:
Y
i 1
i
2
34598
n n n
n X iYi X i Yi
r i 1 i 1 i 1
n n n n
[n X i ( X j ) ][ n Yi ( Yi ) 2 ]
2 2 2
i 1 i 1 i 1 i 1
10(42673 ) (712)(576)
r
[10(54146 ) (712)2 ][(10)(34598 ) (576)2 ]
16618 16618
r
(34516 )(14204 ) 22141,93
r 0,75
Hipotesis:
33
Melalui perhitungan tersebut, diperoleh r hitung sebesar, r 0,75 . Nilai ini
akan dibandingkan dengan t tabel pada tingkat kesalahan α = 0,05 atau
pada taraf signifikansi (1-α) = 0,95.
r n2
t
1 r2
0,75 10 2 2,121
t
1 (0,75) 2 0,661
t 3,209
34
a. Multikollinearity
b. Normality
c. Linerity
d. Homokedasitucity
Kempat asumsi akan dijelaskan secara rinci pada paada Bab IV
dikala membahas asumsi klasik. Analisis korelasi kanonik dapat juga
digunakan untuk mengurai hubungan dari sekelompok variabel
independen. Dalam analisis korelasi ini ada tiga metode yang dapat
digunakan, yaitu:
a. Canonical Weight (Bobot Kanonikal).
Variabel yang memiliki angka weight relative besar (di atas 0,5)
dianggap memberikan kontribusi lebih pada variat.
b. Canonical Loading (Muatan Kanonikal).
Muatan kanonikal mengatur korelasi linear sederhana antara variabel
awal (original) dalam variabel dependen atau independen dan set
canonical variate. Metode ini juga menyatakan korelasi variabel
terhadap variat dimana variabel bergabung dalam setiap
fungsi kanonikal.
c. Canonical Cross Loading (Muatan Silang Kanonikal).
Muatan silang kanonikal dapat dianggap sebagai alternative
canonical loading. Metode ini menyatakan korelasi variabel dalam
suatu variat terhadap variat kanonik lainnya.
Pembahasan yang telah dipaparkan di atas menunjukkan hubungan
antara individu dengan individu lain, tanpa melihat kekuatan hubungan
kelompoknya. Dalam analisis kali ini akan diuraikan hubungan antara satu
kelompok dengan kelompok lain yang terdiri dari beberapa variabel, yang
disebut korelasi kanonik (Canonical correlation). Prinsipnya adalah
mempelajari korelasi antara suatu kombinasi linear dari himpunan beberapa
variabel dengan kombinasi liner dari himpunan yang lain. Kombinasi liner
tersebut disebut variabel kanonik, sementara pasangan variabel kanonik itu
disebut korelasi kanonik.
Korelasi kanonik yang pertama diperkenalkan oleh Hotelling pada
tahun 1936, termasuk analisis korelasi multivariate. Dalam analisis
statistik, korelasi kanonik menunjukkan analisis variabel laten (variabel
yang tidak langsung diteliti) yang secara implisit merepresentasikan
variabel ganda (multiple variable) yang secara langsung dapat diteliti.
Konsep korelasi kanonik dapat juga dijumpai dalam analisis diskriminan.
Analisis korelasi kanonikal adalah model statistika multivariat yang
memungkinkan identifikasi dan kuantifikasi hubungan antara dua himpunan
variabel. Karena titik perhatian analisis ini adalah korelasi (hubungan) maka
kedua himpunan tidak perlu dibedakan menjadi kelompok variabel tidak
bebas dan variabel bebas. Pemberian label Y dan X kepada kedua variat
kanonikal hanya untuk membedakan kedua himpunan variabel. Fokus
35
analisis korelasi kanonikal terletak pada korelasi antara kombinasi linier satu
set variabel dengan kombinasi linier set variabel yang lain. Langkah pertama
adalah mencari kombinasi linier yang memiliki korelasi terbesar.
Selanjutnya, akan dicari pasangan kombinasi linier dengan nilai korelasi
terbesar di antara semua pasangan lain yang tidak berkorelasi. Proses terjadi
secara berulang, hingga korelasi maksimum teridentifikasi. Pasangan
kombinasi linier disebut sebagai variat kanonikal sedangkan hubungan di
antara pasangan tersebut disebut korelasi kanonikal
Analisis korelasi kanonikal digunakan untuk identifikasi dan
kuantifikasi hubungan antara dua himpunan variabel. Analisis ini dapat
digunakan baik untuk data kuantitatif atau metrik maupun data kualitatif
atau non metrik. Kekuatan korelasi antara variabel yang tergabung dalam
variat kanonikal yang sama dinyatakan dalam varians bersama (shared
variance), sedangkan hubungan antara variat kanonik yang berbeda
dinyatakan dalam indeks redundansi (redundancy index). Interpretasi
koefisien variat kanonikal, mencakup tiga besaran, 1. Bobot kanonikal
(canonical weights), 2. Muatan kanonikal (canonical loadings) dan 3.
Muatan-silang kanonikal (canonical cross-loadings).
Misalkan U (X) adalah suatu variat yang merupakan kombinasi
linear dari 3 variabel (X1,X2 dan X3) dan V(Y) adalah variat lain yang
merupakan kombinasi linear dari variabel Y1, Y2 dan Y3 maka korelasi
kanonik dapat ditulis sebagai:
X1
Y1
X2
U Y2
V
(X)
(Y)
Y3
X3
36
Gambar panah satu arah menunjukkan ukuran variabel terhadap
variat kanonik. Sedang panah dua ujung menunjukkan korelasi
kanonik.
37
Sebagaimana diketahui bahwa korelasi kanonik adalah suatu
analisis yang dibangun dari regresi berganda dari kedua sisi persamaan.
Dalam korelasi matriks X dab Y dinyatakan
x1 y1
x y
X 2 Y 2
xn yn
38
U1 a11 X 1 a12 X 2 ... a1 p X p
U 2 a21 X 1 a22 X 2 ... a2 p X p
…..(2.2)
U q a p1 X 1 a p 2 X 2 ... aqp X p
dan
p
Ux aj X j
i 1
q
Vy bhYh
h 1
39
U x aT X dan
V y bT Y
U1 a1T X
V1 b1T Y
Dimana:
40
Var(U1 ) a1T S XX a1 1
Var(V1 ) b1T S XX b1 1
L
S XY b1 2S XX a1 0 (a)
a1
L
S XY
T
a1 2SYY b1 0 (b)
b1
L
a1S XX a1 1 0 (c)
L
b1S XX b1 1 0 (d)
a1T S XY b1 2 * 0 (e)
T
S XY a1 2SYY b1 0 T
kalikan dengan b1 diperoleh
b1T S XY
T
a1 2b1T SYY b1 0
b1T S XY
T
a1 2 0
b1 S XY a1 2 = *
T T
(f)
a S b 2
T
1
T
XY 1
41
* * = Corr(U,V)
Karena
T
S XY a1 * SYY b1 0 , atau
T
S XY a1 * SYY b1 0
S XY a1 * SYY b1 (9)
T
1
S XY b1 * S XX a1 0 kalikan ruas kiri dan kanan dengan SYX S XX
1
SYX S XX S XY b1 * SYX S XX
1
S XX a1
1
SYX S XX S XY b1 * SYX a1
SYX S XX S XY b1 * S XY
1 T
a1 (10)
Sehingga diperoleh
1
SYY 1
SYX S XX S XY b1 *2 SYY
1
SYY b1
atau
1
SYY 1
SYX S XX S XY b1 *2 Ib1
1
SYY 1
SYX S XX S XY b1 *2 Ib1 0
1
( SYY 1
SYX S XX S XY *2 I )b1 0
Dimana
1 1
*2 adalah akar karakteristik dari SYY SYX S XX S XY
1 1
b1 adalah vektor karakteristik dari SYY SYX S XX S XY
* adalah korelasi kanonik antara antara U1 dan V1
1 1
a1 adalah vektor karakteristik dari S XX S XY SYY SYX
atau
42
a1 *1 S XX
1
S XY b1
Untuk menentukan akar dan vektor karakteristik lain diperoleh dengan cara
yang sama.
Sama saja dengan analisis faktor, hasil utama yang akan diperoleh
adalah korelasi kanonik, faktor loading kanonik dan timbangan kanonik
(canonical weight). Analisis juga dapat digunakan untuk menentukan
Proporsi Varians Terekstraksi dan mengukur redundansi (redundancy).
Pengukuran Redundans sangat penting untuk menganalisis, menguji dan
mendesain questioner dan skala pengembangan. Redundans juga dapat
digunakan untuk menjawab atau menjejaskan pertanyaan seperti, kapan
mengukur suatu pertanyaan 5 item atau 3 item, dapatkah dikeluarkan satu
item, dua item untuk keperluan questioner yang ringkas.
Proses Perhitungan
43
Misalkan terdapat dua kelompok variabel sebagai berikut:
1
( S XX 1
S XY SYY SYX I ) A 0
dan
1
( SYY 1
SYX S XX S XY I ) B 0
1
S XX 1
S XY SYY SYX I 0 dan
1
SYY 1
SYX S XX S XY I 0
44
Eigenvalue terbesar dari matriks perkalian
1 1 1 1
S XX S XY SYY SYX atau SYY SYX S XX S XY
1
S XX S XY B
A
dan
1
SYY SYX A
B
1 1
adalah akar karakteristik SYY SYX S XX S XY
1 1
A adalah vektor karakteristik S XX S XY SYY SYX
1 1
B adalah vektor karakteristik SYY SYX S XX S XY
45
R pp R pq
Z
Rqp Rqq
1 1 '
R RXX RXY RYY RYX atau
1 1
R RXX RYX RYY RXY
rci i
ai i1RXX
1
RXY bi , i 1, 2, 3...r
46
Ui aiT X
Vi biT Y
Uji Hipotesis
H0: 1 2 3 ... r 0
H1: Ada i 0
Statistik Uji
1 r
n ( p q 1) ln(1 i )
2 i 1
Titik kritis
Contoh:
47
No. X1 X2 Y1 Y2 Zx1 Zx2 Zy1 Zy2
Korelasi
X1 X2 Y1 Y2
48
Dengan menggunakan rumus:
1 1 '
R RXX RXY RYY RYX
1 1.4251 0.7783
R XX
0.7783 1.4251
1 1.0753 0.2845
RYY
0.2845 1.0753
0.5280 0.6770
R XY
0.2590 0.5820
1 1 T 0.5030 0.3452
R RXX RXY RYY RYX
0.1591 0.1624
RV V
49
( R I )V 0 …… (2.4)
Eigenvalue dari R
0,0430
ai
0,6223
Dengan demikian diperoleh korelasi kanonikal (1)
c1 0,0430 0,2074
dan
c2 0,6233 0,7889
2,8912
V1
1
0,7544
V2
1
50
Analisis korelasi kanonik dapat dianalogikan dengan persamaan
regresi, sehingga koefisinnnya dapat dituliskan dalam bentuk regresi
berganda dengan formula:
1 / 2 T
BY ( RYY ) Vy
2.9989 0.6139
BY
1.3775 0.8901
Sedang
1
B x R xx1 R xy B y ,
rc
rc1 rcm
where rc
r rcm
c1
1
1
Bx RXX RXY By
rc
Dimana
r r
rc c1 c 2
r c1 rc 2
11,3651 0,1488
Bx
1,4022 1,1284
51
Dengan demikian diperoleh Persamaan kanonikal yang pertama
adalah
U 2,9989 x1 1,776 x2
V 0,6139 x1 0,8902 x2
Corr (U ,V ) 0,2074
U 11,3651 x1 0,1488 x2
V 1,4020 x1 1,1284 x2
Corr(U ,V ) 0,2768
Uji Hipotesis
H0: 1 2 3 ... r 0
H1: Ada i 0
Statistik Uji
1 r
n ( p q 1) ln(1 i )
2 i 1
52
1
13 (2 2 1)[ln(1 0.3679 ) ln(1 0.0733)]
2
(10,50)(0,535)
5,618
Titik kritis
2 , pq 2 0,05;4 9,488
df = (kx) (ky)
Matriks Loading
53
Matriks loading (Loading Matrix) adalah matriks korelasi yang
menggambarkan hubungan antara variabel dan koefisien kanonik dengan
formulasi:
A R B
x xx x
dan
A R B
y yy y
Matriks
Variabel
set Koefisien Koefisien Loading
kanonik 1 kanonik 2
X1 12.131749 0.35296629 Ax
X2 7.6095342 0.45514524
Y1 3.3640004 -0.378027 Ay
Y2 2.1722949 0.72750855
a.
X1 Y1
12,13 3,36
0,21 CC1
CC1
X Y
X2 7,61 2,17 Y2
54
b.
X1 0,35 -0,37 Y1
CC1
0,78 CC1
X Y
X2 0,45 0,73 Y2
Gambar:
p 2
a2 q
aryc
pvxc rxc pvxc
i 1 p i 1 q
Redundansi
rd ( pv)rc2
55
Ringkasan:
No
Soal-soal:
1. Mengapa pengukuran asosiasi penting dalam kehidupan manusia
sampai saat ini?
2. Apa yang dimaksud dengan asosiasi itu?
3. Sebutkan contoh-contoh teknik analisis yang termasuk dalam
pengukuran asosiasi!
4. Apa kegunaan pokok teknik analisis korelasi?
5. Bagaimana kedudukan variabel dalam korelasi?
6. Apa maksud korelasi sama dengan 0?
7. Apa maksud korelasi tidak sama dengan 0?
8. Apa maksud korelasi sama dengan + 1 dan juga sama dengan -1
9. Kapan kita dapat menggunakan teknik korelasi?
10. Apa perbedaan antara korelasi dan kausalitas?
11. Apa perbedaan antara korelasi dan linearitas?
12. Apa saja asumsi dalam menggunakan korelasi dan terangkan
maksudnya?
13. Sebutkan karakteristik korelasi!
14. Apa yang dimaksud dengan koefisien korelasi? Berikan contohnya!
15. Apa makna signifikansi dalam korelasi? Terangkan dengan jelas!
16. Apa saja hasil interpretasi dalam analisis korelasi?
17. Bagaimana melakukan pengujian hipotesis dalam korelasi?
18. Apa itu koefisien determinasi?
20. Perlukah kita menghitung koefisien determinasi dalam korelasi?
Berikan penjelasannya.
21. Apa yang dimaksud dengan korelasi kanonik, jelaskan perbedaannya
dengan korelasi product momen
56
BAB III
REGRESI LINEAR SEDERHANA
3.1. Pendahuluan
57
mendeskripsikan fenomena data melalui terbentuknya suatu model
hubungan yang bersifat numerik. Regresi juga dapat digunakan untuk
melakukan pengendalian (kontrol) terhadap suatu kasus atau hal-hal yang
sedang diamati melalui penggunaan model regresi yang diperoleh. Selain
itu, model regresi juga dapat dimanfaatkan untuk melakukan prediksi
variabel terikat
Hubungan antara panas dengan tingkat muai panjang, dapat
dikatakan sebagai hubungan yang kausal, hubungan antara kepemimpinan
dengan kepuasan kerja pegawai dapat dikatakan hubungan yang fungsional,
hubungan antara kupu-kupu yang datang dengan banyaknya tamu di rumah
bukan merupakan hubungan kausal maupun fungsional. Kita gunakan
analisis regresi bila kita ingin mengetahui bagaimana variabel
dependen/kriteria dapat diprediksikan melalui variabel independen atu
variabel prediktor, secara individual. Dampak dari penggunaan analisis
regresi dapat digunakan untuk memutuskan apakah naik dan menurunnya
variabel dependen dapat dilakukan melalui menaikan dan menurunkan
keadaan variabel independen, atau meningkatkan keadaan variabel
dependen dapat dilakukan dengan meningkatkan variabel independen/dan
sebaliknya.
Diketahui bahwa alasan utama dari peneliti sosial menggunakan
analisis regresi adalah prediksi, deskripsi dan kontrol. Dengan prediksi
diharapkan peneliti mendapatkan respons yang didasarkan pada nilai-nilai
variabel bebas atau prediktor yang telah diketahui. Deskripsi
menggambarkan fenomena data melalui terbentuknya suatu model
hubungan yang bersifat numerik, menjelaskan efek dari perubahan
variable yang dikontrol pada nilai rata-ratanya dari variabel responsnya.
Sedang kontrol adalah melakukan konfirmasi bahwa suatu proses betul-
betul dilakukan dalam kondisi tertentu yang diukur dari tingkatan
variabel-variabel predictor (bebas).
Asumsi Ordinary Least Squares Menurut Gujarati (2003) asumsi utama
yang mendasari model regresi linear klasik dengan menggunakan model
OLS adalah:
a. Model regresi linear, artinya linear dalam parameter seperti dalam
persamaan ini Yi = bl+b2Xi+εi
b. Nilai X diasumsikan non-stokastik, artinya nilai X dianggap tetap
dalam sampel yang berulang.
c. Nilai rata-rata kesalahan adalah nol, atau E ( i / X i ) 0
d. Homoskedastisitas, artinya variance kesalahan sama untuk setiap
periode (Homo = sama, Skedastisitas = sebaran) dan dinyatakan
dalam bentuk matematis Var( i / X i ) 2 .
e. Tidak ada autokorelasi antar kesalahan (antara i dan j tidak ada
korelasi) atau secara matematis Cov( i , j ) 0 , i j
f. Antara kesalahan atau error i dan Xi saling bebas, sehingga
Cov( i , X j ) 0 Commented [MSM1]:
58
g. Jumlah observasi n lebih besar daripada jumlah parameter yang
diestimasi (jumlah variabel bebas).
h. Adanya variabilitas dalam nilai X, artinya nilai X harus berbeda.
i. Model regresi telah dispesifikasi secara benar. Dengan kata lain tidak
ada bias (kesalahan) spesifikasi dalam model yang digunakan dalam
analisis empiris.
j. Tidak ada multikolinearitas yang sempurna antar variabel bebas, untuk
regresi dengan 2 variabel bebas atau lebih
59
2. Memiliki nilai rata-rata hitung i = E(Yi) yang terletak pada
garis lurus atau i = E(Yi)= X i yang terletak pada bidang
XY.
3. Variabel-variabel random Yi adalah bebas secara statistik satu
sama lain.
f(Y/x) Y
1
2 3
Y= x
X
Gambar 3.1. Hubungan Variabel Bebas dengan Probabilitas Bersyarat
Y 0 1 X
Dimana:
Y adalah variabel tak bebas (dependent variable)
X adalah variabel tak bebes (independent variable)
adalah suku kesalahan random
60
Y
+e Y b0 b1 X
-e
X
Gambar 3.2. Garis Regresi Sampel
n n
3. e (Y Yˆ )
i 1
2
i
i 1
i
2
n n
4. K ei2 (Yi b0 b1 X i ) 2 …..(3.1)
i 1 i 1
61
K K
0
b0 b1
K
2 (Yi b0 b1 X )(1) 0
b0
K
2 (Yi b0 b1 X )( X i ) 0
b1
atau
Y nb
i 1
i 0 b1 X i 0
……(3.3)
n n n
X Y b X
i 1
i i 0
i 1
i b1 X i2 0
i 1
n n
b0 n b1 X i Yi
i 1 i 1
……(3.4)
n n n
b0 X i b1 X i2 X iYi
i 1 i 1 i 1
62
Penyelesaian secara simultan diperoleh:
n
n Y
i 1
i
n n
X XY
i 1
i
i 1
i i
b1 n
n X
i 1
i
n n
X X
i 1
i
i 1
i
2
atau
n n
n X iYi X iYi
b1 i 1 i 1
……(3.5)
n X i2 ( X i ) 2
atau
x y i i
b1 i 1
n
Xi 1
i
2
dimana
xi X i X i
yi Yi Yi
63
1 n n
b0 ( Yi X i )
n i 1 i 1
b0 Y bX
2K n
a 2
2
i 1
(1) 2n
2K n
b 2
2
i 1
X i2
2K 2K
2 nX
ba ab
Matriks Hessian
2n 2nX
H
2nX
n
2 X 1
H1 2n 0
i 1
n n
H 2 2 n X i n 2 X i2 2 n ( X i X ) 2 0
i 1 i 1
64
H1 H1 0; H 2 0 menunjukkan bahwa fungsi atau persamaan (3.1)
adalah minimum dengan nilai parameter populasi 0 dan 1 , sebagaimana
telah dibuktikan b0 dan b1 masing-masing adalah menduga yang tidak
bias, yaitu E (b0 ) 0 dan E (b1 ) 1 .
1
(Yi 0 1 X ) 2
n 2 2
e
L( 0 , 1 , 2 ) …. (3.6)
i 1 2 2
n
1 n
ln L( 0 , 1 , 2 )
2 2 (Y
i 1
i 0 1 X ) 2 ln( 2 2 ) ….(3.7)
2
(ln L( 0 , 1 , 2 ) 1 n
2 (Yi 0 1 X i )2 (1) 0 ….(3.8)
(0 ) i 1
65
(ln L( 0 , 1 , 2 ) 1 n
2 (Yi 0 1 X 1 ) 2 ( X ) 0 ….….(3.9)
( 1 ) i 1
(ln L( 0 , 1, 2 ) 1 n 1
4 (Yi 0 1 X )2 2 0 ….(3.10)
( 2 ) i 1
(X i X )(Yi X )
b1 i 1
n
(X X )
i 1
2
bo Y b1 X
dan
(y b i 0 b1 x) 2
s
2 i 1
n
66
dilakukan pada OLS dapat dibuktikan bahwa fungsi likelihood adalah
maksimum
Contoh:
Teladan:
Penyelesaian:
n n
n X iYi X iYi
b1 i 1 i 1
n X i2 ( X i ) 2
67
10(18055 ) (436)(364)
b1
10(22086 ) (436)2
b1 21846 / 30764
b1 0.71
436 364
X 43.6 dan Y 36.4
10 10
Sehingga
b0 Y bX
68
X-Xbar= Y-Ybar=
x y xy x^2
Σ 2184.6 3076.4
436 364
X 43.6 Y 36.4
10 10
2184 .6
b 0.71
3076
69
Misalkan diambil X= 55, maka
Sumber JK df RK Fhitung
Variasi
Variasi
54.054
70
Uji F untuk
Hipotesis Statistik:
H 0 : 1 0;
H1 : 2 0
RKR
F*
RKS
Uji Hipotesis:
2
2 b
t* 1 F *
s (b1 )
b0 b1
t1 ; t2
* *
se(b0 ) se(b1 )
71
1 X2
se(b0 ) ˆ
n ( X i X )2
Sedang
ˆ 2 e 2
i
(Y Y ) 2
JKS
n2 n2 n2
ˆ
se(b1 )
(X i X )2
atau
JKS
s(b1 )
( X i X )2
Hipotesis Statistik:
H 0 : 1 0;
H1 : 2 0
72
1 X2
se(b0 ) ˆ
n ( X i X )2
1 1900,96
5,351 =4,534
10 3076,4
b0 5,44
t1 1,1998
*
se(b0 ) 4,534
b1 0,71
t2 7,359
*
se(b1 ) 0,0965
Kriteria:
Jika t * t (1 / 2; n 2) terima Ho
Jika t * t (1 / 2; n 2) terima H1
73
dilambangkan dengan (R2) adalah satu ukuran yang digunakan untuk
mengetahui pengaruh variabel independen terhadap varians variabel
dependen, dengan 0 < R2 < 1. Besaran ini sering disebut ukuran ketepatan
model, semakin mendekati satu berarti model yang dibangun sedemikian
dapat menggambarkan hubungan antara dua variabel (bebas dan tak
bebas). Ukuran ini juga menunjukkan besarnya kontribusi pengaruh
terhadap variabel tak bebas, sedangkan 1- R2 menujukkan pengaruh sisa
dari variabel bebas yang tidak dimasukkan dalam model. Dalam regresi
sederhana koefisien determinasi dinyatakan berhubungan erat dengan
koefisien korelasi sebagai:
R 2 r 2 atau R r
R2
JKT JKS
1
JKS
(Yˆ Y )
i
…..(3.6)
JKT JKT (Y Y )
i
Atau
JKS
Berdasarkan pada persamaan (3.6) diketahui bahwa 0 1 , sehingga
JKT
0 R2 1
74
Selanjutnya persamaan regresi yang diperoleh ( fitted regression equation)
dapat dibedakan dalam dua tipe. Tipe pertama adalah memprediksi nilai
variabel respons Y dengan menentukan suatu nilai xo dari variabel
predictor atau variabel bebas. Dengan demikian dapat ditentukan nilai-nilai
ramalan variabel respons Y. Tipe estimasi kedua adalah estimasi nilai
mean variabel respon 0 pada saat X x0
b0 Y
Atau
1
b0 (Y1 Y2 Y3 ... Yn )
n
Sehingga
1
E (b0 ) ( E (Y1 ) E (Y2 ) E (Y3 ) ... E (Yn ))
n
E (b0 )
E (Y ) i
1
E (b0 )
n
(0 1 X i ) = 0
Dengan cara yang sama diperoleh
2
var(b0 ) (variance bilangan konstan)
n
75
Jadi a dapat dipakai sebagai penaksir bagi
1. E (b1 ) dan
2
2. Var (b1 ) ; xX X
x 2
1
Bukti:
Bukti nomor 1
E (b1 ) E (
x y ) xE ( y) xx x 2
x 2
x 2
x2
x2
Dengan
y Y Y dan x X X
Bukti nomor 2:
Var(b1 ) Var(
xy )
x 2
76
Var(b) Var(
xy ) x var( y ) 2
x x
2 2 2
x 2 2
x 2 2
2
Var(b1 ) ,
x 2
dimana x X X
f(b1)
2
95% var(b)=
x 2
1
2,5% 2,5%
-t0,025 t0,025
E (b1 )
b b
z
b
x 2
i
77
Probabilitas bahwa nilai t berada pada interval antar -t0,025 dan t0,025
adalah 95% atau
b
P( -t0,025 < < t0,025) =0,95
s
x 2
i
s s
P( b1 - t0,025 < < b1 + t0,025 ) =0,95
x 2
i x 2
i
s
1 = b1 t0,025
x 2
i
s
0 = b0 t0,025
n
3.6. Peramalan
E (Y0 ) E (a) X 0 E (b) X 0
78
Diketahui bahwa
X 0 E (Y0 )
Sehingga
E(Y0 ) E(Y0 ) (tak bias)
2 2 1 x02
Var(Y0 ) ( 2 / n) X 02 ( ) , dimana x X X
x2 n x2
1 n
s2 (Yi a bXi )2
n 2 i 1
79
1 ( X 0 X )2
E (Y0 ) Yˆ0 t 0,025.s
n ( X X )2
1 ( X 0 X )2 ˆ t .s 1 ( X 0 X )
2
Yˆ0 t0, 025.s E (Y ) Y
n ( X X )2 n ( X X )2
0 0 0 , 025
Yˆ0 Y0
P t, / 2, n 2 t, / 2, n 2 1
1 ( X 0 X )2
s 1
n (X X ) 2
1 ( X 0 X )2 1 ( X 0 X )2
t
, / 2 , n 2 s 1 , t, / 2, n 2 s 1
n (X X ) 2
n ( X X )2
Contoh:
80
Untuk point estimator:
(Y a bX )
1 JKS
s2 i i
2
n2 i 1
n2
(Y a bX )
1
s i i
2
n2 i 1
1
s (229,587) 28.6984 5.357
10 2
436 364
X 43.6 Y 36.4
10 10
1 ( X 0 X )2
E (Y0 ) Yˆ0 t 0,95 .s
n ( X X )2
1 (75 43,6) 2
E (Y0 ) (1,812)(5,357)
10 3076,4
81
52 ,3956 E (Y0 ) 64 ,9844
Var( yˆ 0 ) Var(Y0 Y0 )
Var(b0 b1 X 0 0 1 X 0 b1 X b1 X 0 )
1 X2 2 2X
2 X 02 2X0 2
n ( X X )2 (X X ) 2
(X X ) 2
1 ( X 0 X )2
var( yˆ0 ) 2 (1
n ( X X )2
1 ( X 0 X )2
SE( yˆ 0 ) 1
n ( X X )2
82
Dalam hal ini 2 umumnya tidak diketahui, prediksi mengikuti distribusi
t dengan derajat kebebasan n-2. Prediksi interval (1 )100 % adalah y0
dalam hal ini dapat ditulis dengan probabilitas
Yˆ0 Y0
P t, / 2, n 2 t, / 2, n 2 1
1 ( X 0 X )2
s 1
n (X X ) 2
1 ( X 0 X )2 1 ( X 0 X )2
Y t
, / 2 , n 2 s 1 , Y0 t, / 2, n 2 s 1
n (X X ) n ( X X )2
0 2
atau
1 ( X 0 X )2 1 ( X 0 X )2
Y0 t, / 2, n 2 s 1 ˆ
y Y t s 1 yˆ 0
n ( X X )2 n ( X X )2
0 0 , / 2 , n 2
1 (75 43,6)2
E ( yˆ0 ) 58.69 1,812 (5,357 ) 1
10 3076 .4
83
atau
Soal
84
d. Sebutkan dan jelaskan kelebihan dan kekurangan fungsi NonLinear
tersebut.
8. Diketahui data berikut:
PDRB Kapital
(Milyar Rp) (Milyar RP)
74.72 1477.80
84.45 41268.40
88.31 40412.90
95.59 1554.20
103.33 56815.20
120.32 111413.3
138.29 74903.80
164.96 128525.0
189.54 155023.9
199.45 135232.5
209.45 145211.5
a. Buat judul dari data tersebut di atas
b. Buat kerangka fikir dan hipótesis dari data tersebut
c. Buat persamaan regresi sesuai dengan hasil pengolahan data Anda
dengan menggunakan Regresi Linear Berganda dengan variabel
Dummy. Regresi Linear dengan variabel dummy. Bandingkan
kedua persamaan Regresi yang diperoleh dan berikan arti dari
setiap parameter yang diperoleh.
d. Tentukan 3 nilai PDRB dengan mengambil nilai kapital masing-
masing: 175211.5; 187211.5 dan 265211.9
85
BAB IV
ASUMSI KLASIK
4.1. Pendahuluan
86
distribusi sampling dari sampel random berukuran n dari suatu distribusi
populasi yang memiliki μ tertentu dan σ2 tertentu, akan berbentuk normal
N(0,1) apabila n → ∞ (central limit theorem; Hogg & Tanis, 1977). Oleh
karena itu, kita tidak perlu terlalu mengkhawatirkan asumsi normalitas ini
sepanjang kita memiliki cukup banyak subjek bagi masing-masing sampel
perlakuan. Di mana kita merasa bahwa normalitas distribusi skor tidak
terpenuhi maka kita hanya perlu mengambil subjek dalam jumlah yang lebih
banyak.
Uji normalitas distribusi Yij pada sampel seperti yang biasanya
dilakukan lewat uji χ2 goodness of fit, tidak perlu dilakukan dikarenakan
distribusi harga F tidak banyak terpengaruh oleh penyimpangan normalitas
distribusi. Pernyataan ini didukung oleh bukti-bukti matematis (Scheffé,
1959 dalam Myers, 1979) dan bukti studi empiris (Boneau, 1960; Bradley,
1964; Donaldson, 1968; Lindquist, 1953 dalam Myers, 1979).
Asumsi Model Regresi Linear:
(Asumsi yang mendasari OLS)
87
E ( i / X ) 0 (3.4)
Persamaan (3.4) tersebut menunjukkan bahwa semua data dalam
matriks adalah bebas secara stokastik X dari i untuk semua i. Hal ini
dapat ditulis:
88
Peubah bebas dan galat saling bebas
4.2. Heterocedasticity
Konsep Heterocedasticity adalah lawan dari homocedasticity.
Ditinjau dari etimologi, homo berarti sama atau equal, scedasticity berarti
disperse atau scatter atau ada yang mengartikan sebaran. Jadi varians dari
error atau disturbance haruslah sama pada masing-masing nilai X. Sebagai
contoh, ada 3 orang dengan gaji 3 juta sehingga memberikan tiga buah error
dan mempunyai varians. Varians ini harus sama (equal) dengan varians error
pada nilai X yang lain misalnya 4 juta, demikian seterusnya. Implikasi dari
asumsi ini adalah bahwa varian skor Yij pada masing-masing kelompok j
adalah homogen (yaitu σ12 = σ22 = σ32 = . . . = σj2 ). Banyak praktisi yang
melakukan uji heterogenitas varian pada data sampel dan menggunakan
hasilnya sebagai dasar untuk menyatakan sah-tidaknya penggunaan analisis
varian. Untuk itu memang terdapat beberapa metode pengujian
heterogenitas varian seperti tes Hartley, tes Bartlett, tes Levene, dan lain-
lain. Namun kegunaan berbagai tes ini mendahului analisis varian adalah
tidak jelas. Isunya bukanlah apakah varian-varian populasi itu berbeda akan
tetapi apakah perbedaan yang ada cukup besar sehingga mengakibatkan
rasio mean kuadrat pada analisis varian menjadi tidak lagi terdistribusi
sebagai F (Myers, 1979). Di samping itu, tes heterogenitas varian yang
biasanya digunakan ternyata sangat sensitif terhadap ketidaknormalan
distribusi populasi sehingga para ahli statistik menganggap prosedur uji
homogenitas ini tidak robust. Dengan demikian uji heterogenitas varian
89
sebelum melakukan analisis varian tidak banyak memiliki nilai praktis, dan
pendapat mutakhir mengatakan bahwa analisis varian dapat dan seharusnya
dilakukan tanpa melakukan uji heterogenitas varian lebih dahulu, terutama
apabila besarnya dalam setiap kelompok sampel adalah sama (Box, 1953,
1954 dalam Hays, 1973).
Asumsi homogenitas varian ini dapat diabaikan tanpa resiko yang
besar selama kita memiliki jumlah n yang sama dalam setiap sampel
perlakuan. Sebaliknya, apabila jumlah n dalam masing-masing sampel
perlakuan tidak sama maka pelanggaran asumsi homogenitas varian dapat
membawa konsekuensi serius terhadap validitas inferensi/kesimpulan
analisis akhir akibat terjadinya distorsi kesalahan tipe I. Dalam kasus n pada
kelompok sampel tidak sama atau kasus perbedaan varian yang sangat besar
di antara kelompok perlakuan, uji signifikansi F masih dapat dilakukan
sesuai dengan level α yang dikehendaki asalkan distribusi populasi
perlakuan masih mendekati normal. Dengan demikian, selama kita memiliki
alasan yang cukup layak untuk menganggap bahwa varian-varian di antara
kelompok perlakuan adalah setara, kita dapat terus melakukan uji F tanpa
kekhawatiran, namun bila kita merasa sangsi akan homogenitas varian yang
terlibat maka gunakanlah n yang setara bagi setiap kelompok sampel.
Uji asumsi klasik berikutnya adalah uji heteroskedastisitas. Dalam
analisis regresi, salah satu asumsi yang harus dipenuhi adalah varians error
masing-masing variabel bebas harus konstan. Hal ini dikenal dengan istilah
Homoskedastisitas. Selain itu dikenal istilah Heteroskedasitas lawan dari
Homoskedastisitas, yaitu keadaan dimana terjadinya ketidaksamaan varian
dari error untuk semua pengamatan setiap variabel bebas pada model regresi
Heteroskedastisitas (heteroscedasticity) menunjukkan arti varians
yang tidak sama), yang berarti melanggar asumsi homoskedastisitas dari
CLRM (classical linear regression model) yaitu suku kesalahan i
terdistribusi secara random dengan mean nol dan varians tetap sama
dengan 2 atau secara matematika statistik ditulis:
E ( i \ X i ) 0 dan Var ( i \ X i ) 2 ini disebut homoscedasticity. Sedang
lawannya, Heteroskedastisitas, tentu dinyatakan Var( i \ X i ) i 2
dimana X i adalah mean dari { X i 2 ,....., X ik } untuk i=1,2,…n.
Sebenarnya, OLS dapat diterapkan pada data homoskedastik dan data
heteroskedastik hanya saja jika diterapkan pada heteroskedastik maka akan
menghasilkan parameter atau estimasi yang tidak efisien.
90
Gamar 4.1
f(Y/x) Y
1
2 3
Y= x
x
Gambar 4.2.
Gambar 4.1 dan gambar 4.2 menunjukkan terjadinya dua situasi yang
saling bertentangan, pada yang disebutkan pertama berarti terjadi
homoskedastisitas dan yang terakhir terjadi heteroskedastisitas. Selanjutnya
dapat di diberikan contoh secara rafik hubungan antara pendapatan
(diurutkan datanya) dengan kesalahan pengganggu sebagai berikut:
91
Gambar ….
Telah disebutkan di atas bahwa, suatu asumsi pokok dalam model
regresi linear klasik adalah bahwa varians setiap disturbance term yang
dibatasi oleh nilai tertentu mengenai variabel-variabel bebas adalah
berbentuk suatu nilai konstan yang sama dengan 2 . Jika tidak dapat
dipenuhi maka terjadi heteroskedastisitas (heteroscedusticity) pada model yang
disebut model heteroskedastik (heteroscedastic models), sebagai contoh:
ns ns
X
1 1 1
Ys Yis dan X s dengan Var( s ) ( ) 2 hs
2
is
ns i 1
ns i 1
ns
Ys X s s
2. Koefisien random
92
Intercept dan kemiringan sangat random sepanjang I sehingga
persamaannya ditulis:
Yi i i X i dimana
E ( i )
E ( i )
Var ( i ) 2
Var ( i ) 2 dan
Cov ( i , i ) , jadi
Yi X i i
Dengan
i ( i ) ( i ) X i
Var ( i ) 2 2X i 2 X i2
2 (1 1 X i 2 X i2
2 h1
Yi X i i
Var ( i ) 2 ( X i ) 2 2 hi
93
Konsekuensi terjadinya heteroskedastisiti
Situasi heteroskedastisiti akan menyebabkan penaksiran
koefisien –koefisien menjadi tidak efisien. Hasil taksiran dapat menjadi
kurang atau melebihi dari semestinya sehingga akan menyesatkan.
(Arief, 2002). Adapun konsekuensi yang ditimbulkan menurut Dimitrios
Asteriou and Stephen G. Hall (2015) adalah:
1. Estimator OLS masih tidak bias dan konsisten. Hal ini disebabkan
karena tidak satu pun dari variabel explanatory yang berhubungan
dengan kesalahan penganggu. Sehingga persamaan tertentu akan
memberikan nilai koefisien yang sangat mendekati dengan
parameter sebenarnya.
2. Mempengaruhi distribusi koefisien estimasi yang membuat
peningkatan variance distribusi sehingga membuat estimator OLS
tidak efisien
3. Mengecilkan dari varians estimator menyebabkan nilai t dan F
menjadi lebih tinggi dari sebenarnya atau varians dan covarians
estimasi dari regresi akan menjadi bias, sehingga uji F dan uji t
tidak valid.
Cara Mendeteksi
Ada beberapa cara yang dapat dilakukan untuk mendeteksi terjadinya suatu
heteroskedastisity dalam suatu model regresi, diantaranya:
94
Contoh menggunakan Metode Park dengan dua variabel bebas (predictor)
i 2 AX X i
Atau
ln( i ) ln A ln X 1 ln X 2
2
95
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
i 2 didekati dengan ei 2
Sebelum transformasi
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
96
Y= 7,484 + 0.021X1 + 0.123X2
Setelah transformasi:
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Y*= 0,006+0.929X1*+0.434X2*
Y 7.484 0.123 X 2
Y* ; X 1* ; X 2*
X1 X1 X1
Atau
Y 7.484 (0.123)
0.006 0.929 0.432
X1 X1 X1
97
Mengatasi heteroskedastisitas
Y 0 1 X 1 2 X 2 ........ k X k
Y X X
0 1 2 2 ........ k k
X1 X1 X1 X1 X1
4.3. Multikolinearitas
X2
Y Y
X2 X1
X1
a. Tidak terdapat b. Terdapat multikoli
Multikolineritas neritas
( X ,Y )
Y
X
X
99
Masalah kolineritas berganda terdapat juga apabila titik
pengamatan dalam diagram sebaran sangat terpusat sekitar nilai
tertentu walaupun tidak terletak pada suatu garis vertikal
Yˆ a bx
Y
Yˆ x
X
X
x (X X )
2 2
Sangat kecil sementara nilai 2 tetap, maka nilai Var (b) adalah
sangat besar
E (Y ) 0 1 X 1 2 X 2
100
X1 = k1 + k2 X2
Yang berarti
x1 = k2 x2
n n
b1k22 xi22 b2 k2 x22 k2 x2 yi
i 1 i 1
n n
b1k2 x22 b2 xi22 xi 2 yi **
i 1 i 1
Dengan demikian
k22 k2
D k22 k22 0
k2 1
Sebagai contoh
X= 0,01 Z
Maka kemungkinan
Atau
Konsekuensinya:
a. Koefisien-koefisien menjadi tidak dapat ditaksir
101
b. Nilai standard error setiap koefisien regresi menjadi tak terhingga.
c. Seandainya variabel-variabel tidak mengandung korelasi yang sempurna
di antara sesamanya dan diperoleh nilai-nilai koefisien, maka
pengaruh setiap variabel bebas tidak signifikan secara statistik
Cara mendeteksi:
Cara lain untuk mendeteksi adanya multikolinieritas adalah dengan melihat
besar kecilnya angka tolerance. Tolerance didefinisikan sebagai proporsi
variabilitas suatu variabel yang tidak dijelaskan oleh variabel-variabel lain,
yaitu (1–R2). Harga tolerance yang kecil menandakan adanya
interdependensi antara variabel yang bersangkutan dengan variabel variabel
prediktor lainnya, dan merupakan pertanda adanya multikolinearitas.
Selain dari pada itu juga dapat menggunakan rumus variance inflation
factor (VIF) dengan rumus :
1
VIF ( j )
1 R j2
Rj2 adalah koefisien determinasi Xj dengan variabel predictor lainnya.
Jika lebih kecil 10 maka tidak ada korelasi dan jika di atas 10 terjadi
multikolineritas.
Cara Mengatasi:
1. Mentrasformasikan variabel-variabel menjadi bentuk first difference
2. Menambah jumlah data/sampel
3. Mengurangi atau menghilangkan variabel penjelas yang terindikasi
memiliki hubungan dengan variavel penjelas yang lain
4. Memilih model regresi terbaik dengan variabel penjelas yang bebas
multikolinearitas menggunakan metode elimination procedure (forward,
backward dsb)
5. Menggunakan analisis lanjutan yaitu Principal Component Analysis
(PCA) atau Factor Analysis (FA)
6. Mengganti analisis regresi linier berganda dengan SEM atau path analysis
7. Menggunakan pendekatan analisis modern seperti bayesian, NN dsb
Contoh:
102
Periksa data dan jika ternyata terdapat multocolineritas maka berikan proses
mengatasinya
T.
Tahun Profit Promosi Sales
2001 39 49 4.5
2002 41 45 4
2003 44 47 4.5
2004 47 55 7
2005 51 60 7.5
2006 52 67 8.38
2007 54 61 7.63
2008 57 72 9
2009 58 68 8.5
2010 60 74 9.25
2011 62 76 9.5
2012 63 77 10
2013 65 78 10.5
2014 63 82 11
2015 60 84 12
2016 55 85 12
103
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
R2 = 0,808
104
1. Variabel respons dibiarkan tanpa transformasi
2. Variabel bebas promosi (X1) diakarkan sedang varaibel X2
dipangkat tigakan, yang sebelumnya telah dilakukan beberapa
kemungkinan, tetapi inilah transformasi yang dipandang tepat:
X 1* X 1 dan X 2 X 2
* 3
2002 41 45 4 6.7082 64
105
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
R2 = 0,885
106
Contoh lain:
107
ANOVA, tetapi nilai t pada setiap variabel bebas X tidak ada yang
signifikan.
4.4. Autokorelasi
2 jika s 0
E ( t , t s )
0 jika s 0
108
2. Tidak memasukkan variabel tertentu yang sebetulnya turut
mempengaruhi dependent variable.
Yt 0 1P1t 2Ct vt
Sehingga memenuhi
vt 3 P2t t
Jelas terjadi relasi diantara error term
MC
Y 0 1 X 2 X 2 e
Y = Marginal Cost
X = jumlah output
Y 0 1 X w
109
w 2 X 2 e
St 0 1Pt 1 et
Hasilnya:
et tidak lagi bersifat random tetapi mengikuti suatu pola sarang laba-
laba.
5. Time lags
6. Manipulasi data
t t
waktu waktu
0 0
t t
waktu waktu
110
Akibat Adanya Korelasi Serial diantara Error term:
1. Varian residual (error terms) akan diperoleh lebih rendah dari pada
semestinya sehingga R2 menjadi lebih tinggi dari pada seharusnya
2. Pengujian hipotesis statistik dengan menggunakan t-ststistics dan F-
ststistics akan menyesatkan.
3. Estimator yang dihasilkan masih unbiased, konsisten, dan asymptotical
normally distributed. Tetapi tidak lagi efisien->varians tidak minimum
(tidak BLUE)
4. Pemerikasaan terhadap residualnya akan menemui permasalahan.
5. Autokorelasi yang kuat dapat pula menyebabkan dua variabel yang tidak
berhubungan menjadi berhubungan. Biasa disebut spourious regression.
Hal ini terlihat dari R2.
H1 : 0
et Yt Yˆt
(e t et 1 ) 2
DW t 2
n
e
t 1
2
t
Kriteria
D E
A B C
0 dL du 2 4- du 4- dL 4
Contoh:
112
Nilai DW adalah sebesar 1.338. Nilai DW hitung ini kemudian akan
dibandingkan dengan DW Tabel. Dengan signifikansi 5%, jumlah sampel
84, dan jumlah variabel independen adalah 2, maka diperoleh DW hitung
sebesar dl 1.600 dan du 1.696
Perhatikan :
Cara mengatasi:
t = t 1 + v t
113
(Yt - Yt 1 )= o (1- )+ 1(X1t - X1(t-1) ) + ……+ k(Xkt - Xk(t-1) ) + (
t - t 1 )
Atau
Yt = 0 + 1 X t* + ……+ 1 X k*
*
Dimana:
Yt = (Yt - * Yt-1 )
*
X 1 = (X1t - * X1(t-1) )
*
et = 0,679 et 1 + v t
Dan
*
Yt = 11,351 + 0,060 X t*
Dimana
*
Yt = (Yt -0,679Yt-1 )
*
X 1 = (X1t -0,679X1(t-1) )
114
Pola Autokorelasi
,e ,e
waktu
waktu
0 0
,e ,e
waktu
waktu
waktu
Yˆ = b + cX Regresi sebenarnya
115
Contoh:
Cochrane-Orcutt Procedure
Tabel ….
X Y X t' X t Yt ' Yt
1 19 16 -7.355 _ _ 54.0960 _ _ _ _
116
10 54 37 0.695 -1.2 3.5721 0.4830 -0.8305 1.428025 20.2686 14.5124
X t' X t 0,6614 X t 1
Validitas
118
evaluasi yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Validitas Logis terdiri dari Validitas Isi dan Validitas Konstruk,
(2) Validitas Empiris, yaitu apabila instrumen tersebut telah teruji dari
pengalaman. Validitas Empiris terdiri dari validitas “ada sekarang” dan
validitas predictive. Uji validitas atau kesahihan digunakan untuk
mengetahui seberapa tepat suatu instrument (alat ukur) mampu melakukan
fungsinya. Alat ukur yang dapat digunakan dalam pengujian validitas suatu
instrument adalah angka hasil korelasi antara skor pernyataan (baik berupa
item atau butir setiap pertanyaan maupun skor dari faktor atau variabel)
dengan total skor seluruh pertanyaan. Uji Validitas yang sering dipakai
adalah uji korelasi Pearson (product moment) yang telah dibahas secara
detail dalam bab 2.
Reliabilitas
n
S
i 1
i
2
R (1 )
n 1 S i2
119
Dimana:
R = koefisien reliabilitas
n
S
i 1
i
2
jumlah ragam tiap-tiap item
S i2 ragam total
Soal:
120
d. Uji kemungkinan terjadinya korelasi serial (autocorrelation),
jelaskan penyebabnya
e. Uji kemungkinan adanya heterosdusticity,
f. Uji normalitas dari data
4. Jelaskan akibat dari pelanggaran asumsi klasik ( Berikan cara untuk
mengatasinya).
121
BAB V
REGRESI LINEAR BERGANDA
Y = 0 + 1 X1 + 2 X2 + 3 X3 + … + n Xn + ε (5.1)
atau
122
n
Yi 0 X
j 1
ij i i
(5.2)
Persamaan (5.1) menunjukkan linear dalam variabel yang terdiri dari satu
variabel respon dan beberapa variabel prediktor atau bebas. Dengan asumsi
i 0, sebagaimana yang telah dikemukakan maka persamaan (5.2) dapat
dinyatakan dengan fungsi regresi atau probabilitas sebagai:
E (Y ) 0 + 1 X1 + 2 X2 + 3 X3 + … + n Xn (5.3)
Bidang Regresi
X2 Bidang X1 dan X2
X1
123
E (Yi ) 0 1 X i1 2 X i 2 , i 1,2,3...n (5.4)
Yi 0 1 X i1 2 X i 2 i …..(5.5)
Yi b0 b1 X i1 b2 X i 2 ei …..(5.5)
Yˆi b0 b1 X i1 b2 X i 2
Diketahui bahwa
ei Yi Yˆi Yi b0 b1 X i1 b2 X i 2
Nyatakan
n
K e (Y b
2
i
i 1
i 0 b1 X i1 b2 X i 2 ) 2
Jadi
n
K (Yi b0 b1 X i1 b2 X i 2 ) 2 …..(5.5).
i 1
124
Persamaan (5.5) dapat diminumkan dengan mendiferensialkannya terhadap
n
K (Yi b0 b1 X i1 b2 X i 2 ) 2
i 1
K n
2 (Yi a0 b1 X i1 b2 X i 2 ) (1) 0
a i 1
K n
2 (Yi a0 b1 X i1 b2 X i 2 ) ( X i1 ) 0
b1 i 1
K n
2 (Yi a0 b1 X i1 b2 X i 2 ) ( X i 2 ) 0
b2 i 1
n n n
a0 X i1 b1 X i21 b2 X i1 X i 2 X i1Yi
i 1 i 1 i 1
n n n
a0 X i 2 b1 X i1 X i 2 b2 X i22 X i 2Yi
i 1 i 1 i 1
…..
a0 ,b1 dan b2
125
n Y X 2
X 1 X Y 1 X X
1 2
X X Y X
2
2 2 2
b1
n X 1 X 2
X1 X 1
2
X X
1 2
X X X X
2
2 1 2 2
n X 1 Y
X 1 X 1
2
X Y 1
b2
X 2 X X 1 2 X Y 2
n X 1 X 2
X1 X 1
2
X X 1 2
X X X X
2
2 1 2 2
Yˆi a0 b1 X i1 b2 X i 2 ... bk X ik
n n n
na0 b1 X i1 b2 X i 2 ... X ik Yi
i 1 i 1 i 1
n n n n
a0 X i1 b1 X b2 X i1 X i 2 ... X i1 X ik X i1Yi
2
i1
i 1 i 1 i 1 i 1
n n n n
a0 X i 2 b1 X i1 X i 2 b2 X i22 ... X ik2 X i 2Yi
i 1 i 1 i 1 i 1
………………………………………………………..
n n n n
a0 X ik b1 X i1 X ik b2 X i 2 X ik ... X ik2 X ikYi
i 1 i 1 i 1 i 1
…….(5.4)
126
Atau secara matriks dapat ditulis
n
X 1i X 2i X ki b0 1
1 1 1 Y1
X 1i X 2
1i X X 1i 2i X X
1i ki b1 X 11 X 12 X 13 X 1n Y2
X 2 i X X X 2
X X b X 21 X 22 X 23 X 2 n Y3
1i 2i 2i 2i ki 2
X ki X 1i X ki X 3i X ki X ki2 bk X k1 X k2 X k3 X kn Yn
yi (Yi Y )
xi ( X i X )
Yˆi a0 b1 X i1 b2 X i 2 ... bk X ik
Y a0 b1 X 1 b2 X 2 ... bk X k Kurangkan
Yˆi Y b1 ( X i1 X 1 ) b2 ( X i 2 X 2 ) ... bk ( X ik X k )
Atau
n n n
b1 xi21 b2 xi1 xi 2 ... xi1 xik xi1 yi
i 1 i 1 i 1
n n n
b1 xi1 xi 2 b2 xi22 ... xi 2 xik xi 2 yi
i 1 i 1 i 1
……………………………………………
127
n n n
b1 xi1 xik b2 xi 2 xik ... xik2 xik yi
i 1 i 1 i 1
n n
b1 xi21 b2 xi1 xi 2 xi1 yi (5.4)
i 1 i 1
n n
b1 xi1 xi 2 b2 xi22 xi 2 yi (5.5)
i 1 i 1
x
i 1
y
i1 i x
i 1
x
i1 i 2
n n n n n n
x
i 1
y
i2 i x
i 1
2
i2 xi1 yi ( xi22 ) xi1xi 2 xi 2 yi
b1 n n
= i 1
n
i 1
n
i 1
n
i 1
x 2
i1 x x
i1 i 2 x ( x
i 1
2
i1
i 1
2
i2 ) ( xi1 xi 2 ) 2
i 1
i 1 i 1
n n
x
i 1
x
i1 i 2 x
i 1
2
i2
n n
x
i 1
2
i1 x
i 1
y
i1 i
n n n n n n
x
i 1
x
i1 i 2 x
i 1
y
i2 i xi 2 yi ( xi21 ) xi1xi 2 xi1 yi
b2 n n
= i 1
n
i 1
n
i 1
n
i 1
x 2
i1 x x
i1 i 2 x ( x
i 1
2
i1
i 1
2
i2 ) ( xi1 xi 2 ) 2
i 1
i 1 i 1
n n
x
i 1
x
i1 i 2 x i 1
2
i2
a0 Y b1 X1 b2 X 2
128
Bentuk matriks persamaan Regresi linear Berganda dengan k variabel
bebas dapat dinyatakan sebagai:
Y =X + (5.6)
Dimana:
Y1 1 X 11 X 12 X 1k 0 1
Y 1 X X 22 X 2 k
Y 2 , X 21
, β , dan ε 2
1
Yn 1 X n1 X n 2 X nk
k k
n
L i2 t Y Xβ Y Xβ
t
(5.7)
i 1
L Y t Y β t X t Y Yβ t X t β t X t Xβ (5.8)
129
L Y t Y 2β t X t Y β t X t Xβ (5.9)
L
2X t Y 2(X t X)β̂ 0
β
(X t X)β̂ Xt Y (5.10)
β̂ (X t X) -1Xt Y
Dimana:
Koefisien Korelasi
n n n
b1 x y b x y ... b x y
i 1
1 2
i 1
2 n
i 1
n
R n
……(3)
i 1
y2
Dimana:
xX X
Koefisien Determinasi
130
Koefisien determinasi disimbolkan dengan R 2 , menjelaskan
variasi pengaruh variabel-variabel bebas terhadap variabel terikatnya, atau
dapat pula dikatakan sebagai proporsi pengaruh seluruh variabel bebas
terhadap variabel terikat, sehingga 1 R 2 menjelaskan besarnya pengaruh
variabel bebas yang tidak dimasukkan dalam model. Formulasi R 2 dapat
dinyatakn sebagai
n n n
b1 x y b x y ... b x y
i 1
1 2
i 1
2 n
i 1
n
R2 n
; xX X
i 1
y2
(1 R 2 )( n 1)
2
Radjusted 1
n k 1
Dimana:
n = jumlah observasi
k = jumlah variabel bebas (repressors)
Uji F
Uji F digunakan untuk menguji secara simultan ( bersama-sama)
pada konsep regresi linier berganda untuk mengetahui penerimaan atau
penolakan model regresi yang digunakan. Jadi uji ini bertujuan untuk
mengetahui adanya pengaruh variabel-variabel bebas terhadap variabel
terikat, atau paling sedikit ada satu variabel bebas yang berpengaruh terikat
variabel terikat (tak bebas) atau memiliki hubungan linier (linear relation).
Formulasi yang digunakan adalah
131
R 2 /( k 1)
F
(1 R 2 ) /( n k )
R 2 /( k 1)
F
(1 R 2 ) /( n k )
k = jumlah variabel bebas
n = jumlah observasi
Hipotesis Statistik:
Kriteria:
F hitung ≤ F tabel (dbi; α) , yang berarti Ho diterima
F hitung > F tabel (dbi; α) , Ho ditolak, yang berarti H1 diterima
Analisis Varians
Sumber JK df RK Fhitung
Variasi
Regresi
JKR= (Y Y )
i
2 k
RKR
JKR
k
RKR
RKS
Kesalahan
JKS= (Y i Yi ) 2 n-(k+1) RKS= JKS/n-k-1
Total JKT= (Y Y )
i
2 n-1
RKT
JKT
n 1
132
Uji t
Hipotesis Statistik:
Hipotesis
Ho : β1 = 0, Variabel X1, tidak berpengaruh signifikan terhadap variabel
Y
Ha : β1 ≠0, Variabel X1 berpengaruh signifikan terhadap Y
Kriteria:
t hitung ≤t tabel = Ho diterima
t hitung > t tabel = Ho ditolak, H1 diterima
bi
ti , i = 1,2, 3 …………n ……. (5.11)
sbi
se
sb1
X 1
2
nX 12 1 r12 2
atau
se
sb1 x1 ( X 1 X 1 )
x 1 r
, dimana
2 2
1 12
sedang
se
sb2
X 2
2 nX 22 1 r12 2
atau
133
se
sb2 x2 ( X 2 X 2 )
x 1 r
, dimana
2 2
2 12
se
(Y Yˆ ) 2
atau
n k 1
se
y 2
b1 x1 y b2 x2 y
n (k 1) , x2 ( X 2 X 2 )
Standar error
Tolak Ho Tolak Ho
Ho
-t α/2 t α/2
Contoh Soal:
- -
1 7 4 2 14 8 4 -9.8 13.8 7.4 96.04 190.4 135.2 72.52 102.12 54.76
- -
2 11 5 3 33 15 9 -5.8 12.8 6.4 33.64 163.8 74.24 37.12 81.92 40.96
-
3 16 8 5 80 40 25 -0.8 -9.8 4.4 0.64 96.04 7.84 3.52 43.12 19.36
-
4 18 10 4 72 40 16 1.2 -7.8 5.4 1.44 60.84 -9.36 -6.48 42.12 29.16
- -
5 10 25 14 140 350 196 -6.8 7.2 4.6 46.24 51.84 48.96 31.28 33.12 21.16
134
6 21 22 15 315 330 225 4.2 4.2 5.6 17.64 17.64 17.64 23.52 23.52 31.36
7 25 19 16 400 304 256 8.2 1.2 6.6 67.24 1.44 9.84 54.12 7.92 43.56
8 21 27 15 315 405 225 4.2 9.2 5.6 17.64 84.64 38.64 23.52 51.52 31.36
9 31 26 16 496 416 256 14.2 8.2 6.6 201.6 67.24 116.4 93.72 54.12 43.56
-
10 8 32 4 32 128 16 -8.8 14.2 5.4 77.44 201.6 -125 47.52 -76.68 29.16
168 178 94 1897 2036 1228 0 0 0 559.6 935.6 216.6 317.8 362.8 344.4
n n
b1 xi21 b2 xi1 xi 2 xi1 yi
i 1 i 1
n n
b1 xi1 xi 2 b2 xi22 xi 2 yi
i 1 i 1
b1 = 0.459
b2= 0.282
n n
b1 x yb x y
i 1
1 2
i 1
2
R2 n
…………….(3)
i 1
y2
135
R 2 0,720
R R2
R 0.720
R 0,849
Uji F
R 2 /( k 1)
F
(1 R 2 ) /( n k )
0,72 /(3 1)
F 9.00
(1 0.72) /(10 3)
Sumber JK df RK Fhitung
Variasi
Regresi JKR= 248,180 2 RKR=124,090 RKR =9.027
Kesalahan JKS= 96,22 7 RKS=13,747 RKS
Total JKT= 344,400 9 RKT 38,267
se
sb1
X 1
2
nX 12 1 rX 1 X 2
2
Atau
se
sb1 dimana
x 1 r
2
1 X 1X 2
2
se
y 2
b1 x1 y b2 x2 y
n (k 1)
136
344.4 0.459(317.8) 0.282(362.8) 96.4125
se 3.71123
n (k 1) 10 (2 1)
3.71123
sb1 0.16441
559,61 0.299 2
Sehingga t hitung
b1 0.459
t hitung 2.7915
s(b1 ) 0.16441
se
sb2
X 2
2
nX 22 1 rX 1 X 2
2
3.71123
sb1 0.12715
935,61 0.299 2
b2 0,282
t hitung 2,214
s(b2 ) 0,12715
137
Menghitung korelasi parsial
Correlations
N VAR00003 10 10 10
VAR00001 10 10 10
VAR00002 10 10 10
rx 2 y (rx1 y )(rx1x 2 )
rx 2 y. x1
[1 (rx1 y ) 2 ][1 (rx1x 2 ) 2 ]
138
0.724 (0.639)(0.299) 0.529 0.529
rx1 y..x 2 0.720
[1 (0.639) 2 ][1 (0.299) 2 ] 0.592(0.911) 0.734
Y = b0 + b1 X1 + b2 X2 + … + bn Xn + ε
Ditransformasikan ke bentuk:
(Y Y ) ( X X1) (X 2 X 2) (X n X n )
1 1 2 ... n E
Sy S X1 S X2 S Xn
Atau
Y * 1 X 1* 2 X 2* ... n X n* E
Dimana:
139
Y * Y
n bn
X n* X n
Y 0,32 X 1 0,41 X 2
5.4. Prediksi
Y0 X 0t b
Y0 E (Y / X 0 )
t t, / 2, n 2 1
, / 2, n k s 1 X t ( X t X )t X
0 0
140
Yˆ t
0 , / 2, n k
s 1 X 0t ( X t X )t X 0 E (Y / X 0 ) Yˆ0 t, / 2, n k s 1 X 0t ( X t X )t X 0 1
c X 0t b
c t , / 2, n k s 1 X 0t ( X t X )t X 0 , c t, / 2, n 2 s 1 X 0t ( X t X )t X 0
Jadi Y prediksi ( Y0 ) diantara interval kedua nilai, sehingga
c t, / 2, n k s 1 X 0t ( X t X )t X 0 Y0 c t, / 2, n k s 1 X 0t ( X t X )t X 0
Soal-soal
141
4. Buat Regresi Linear Berganda dengan menggunakan data
hipotetis. Model yang dibuat harus didasarkan pada teori, seperti
misalnya teori konsumsi dari Keynes. Setiap mahasiswa harus
mengerjakan datanya sendiri, berbeda dengan data mahasiswa lain.
a. Jelaskan persamaan regresi yang diperoleh.
b. Buat judul mengenai untuk analisis Anda
c. Variabel apa yang memberikan pengaruh lebih besar Jelaskan
mengapa?
d. Berapa nilai koefisien korelasi ganda dan koefisien
determinasinya? Apa artinya?
142
BAB VI
REGRESI NON LINEAR
6.1. Pendahuluan
143
Yn f ( X k , )
`dimana
adalah parameter dan berbagai fungsi atau regresi nonlinear lainnya yang
akan diutarakan dalam bab ini.
Production, Consumption
144
nonlinear. Selanjutnya kedua kelompok ini dapat dipecah kepada beberapa
bagian (Gambar 6.2).
Fungsi Regresi
regresi nonlinear terbagi kepada fungsi yang memiliki bentuk liner dan
yang tidak memiliki bentuk linear, selanjutnya kedua bentuk non liner ini
dibagi lagi kepada beberapa bagian (Gambar 6.2).
Parabola kuadratik
145
Yt o 1 X t 2 X t2 t
Parabola kubik
Yt o 1 X t 2 X t2 3 X t3 t
b. Eksponen
Y ab X eu
atau bentuk lain
Y aebX eu
c. Invers Eksponensial
eY ab X eu
Y aX b eu
e. Logistik
ez eu
Y e , atau Y , dimana z = a+bx
1 e z
1 ez
146
f. Invers
b
ln Y a
X
g. Hiperbola
1
Y
a bX
1
a bX
Y
ui
4 Hiperbola b b b
Y a
X ( aX b ) X 2
5 Eksponensial Y e a bX bX bea bX
147
Transformasi
Transformasi adalah upaya untuk mengubah skala pengukuran,
mengubah bentuk regresi ke dalam berbagai bentuk yang sesuai dengan
diagram pencar data. Pada diagram pencar dapat diperhatikan dan
ditetapkan bentuk yang sesuai dengan data yang dianalisis. Penggunaan
transformasi dapat dilakukan jika model (linear atau dilinearkan)
melanggar asumsi regresi linear atau mendapatkan hasil yang tidak
signifikan pada tingkat kesalahan tertentu (misalnya α=0,05). Dalam hal ini
variabel bebas atau variabel tak bebas dapat ditramsformasi. Jika
transformasi dilakukan pada variabel tak bebas maka disebut transformasi
fungsi regresi, sehingga transformasi ini juga mengambil beberapa bentuk,
tergantung transformasi yang akan diterapkan dalam variabel tak bebas ini.
Beberapa bentuk transformasi
Y o 1 X 1 2 X 2
Y o 1 ln( X 1 ) 2 ln( X 2 )
Yt o 1 X t 2 X t2 t
1
Yt o t
X
148
Transformasi fungsi invers eksponensial
eY o 1 X t
n
Y A X i e u ,
bi
i 1
Atau
n
ln Y ln A bi ln X i +
i 1
Y AK L eu , 1 (bentuk asli fungsi Cobb
Douglas)
Y A L 1 K
1/
dimana:
Q = output/ jumlah produksi
K = kapital
L = tenaga kerja
1
, dan -1 < <
(1 )
a. Fungsi Translog (transcendental logaritmic function)
149
n m
n
bi (0,5) ln X i ln X j
Y A X i e b i 1 i 1 j 1
i 1
Atau
n n m
ln Y ln A bi ln X i (0,5)bi 1 ln X i ln X j
i 1 i 1 j 1
Atau
2
(Rnew Rold
2
)/ p
F
(1 Rnew ) / (n k)
2
150
6.3. Regresi Nonlinear Geometrik
Regresi non linear geometrik adalah salah satu regresi yang paling
umum digunakan dalam penelitian dengan fungsi bentuk geometrik.
Regresi nonlinear bentuk geometrik atau disebut juga power dapat
dinyatakan :
Y aX b eu
ln Y ln a b ln X
Bukti:
Y AX
dY
AX 1
dX
151
dY Y
dX X
Sehingga
dY
dY X Y
dX
dX Y Atau X
Contoh:
n X *i Y *i X *i Y *
b
i
152
n X *i ( X *i )
2 2
n n
n X *iY *i X *i Y *i
b1 i 1 i 1
n X *i2 ( X *i ) 2
X * ln( X )
Y * ln( Y )
10 (128,81) (36,44)(34,69)
b
10 (136,68) (36,44) 2
a = 1.2532 dan
b = 0,6083
Dari persamaan :
ln Y 1.253 0.608 ln X
Y 3,5015 X 0.608
Makna persamaan tersebut jika X naik atau turun 1% maka Y akan naik
atau turun 0,608 %. Demikian juga jika X=1 atau 100% maka Y=
3,5015
Y a0 a1 X a2 X 2 e
153
dY
a1 2a2 X
dX
1 3 2 4 6 12 4 16 8
154
n Y X 2 10 135 934
X 1 X Y X X 1 1 2 90 1230 10482
X X Y X
2
934 11908 124342 20118720
b1
2 2 2
n X X 1 2
10 90 934 2914176
X1 X X
2
X 1 1 2
90 934 10482
X X X X
2
934 10482 124342
2 1 2 2
=6.9037
10 90 135
90 934 1230
934 10482 11908 1180640
b2 = -0,40514
10 90 934 2914176
90 934 10482
934 10482 124342
b0 Y b1 X1 b2 X 2 13.5 6.9037 (9) 0.40514 (93.4) -10.7939
dY
6,9037 2(0.40514 ) X 0
dX
dY
6,9037 2(0.4051) X 0
dX
0.8102 X 6,9037
X 8,5210
d 2Y
0.8120 < 0
dX 2
155
Jadi fungsi tersebut maksimum pada saat X = 8,5210
dengan nilai maksimumnya
Y ab X
ln Y ln a (ln b) X
atau dengan bentuk probabilistik atau persamaan regresi (statistik)
Y abcX e
ln Y ln a (ln b) cX
a* ln( a )
Y * ln( Y )
b* c ln( b)
Y * a * b * X
Sehingga persamaan
156
Y ae cX e
ln Y ln a cX
Y * a * cX *
Contoh:
Diketahui data berikut:
Tahun 1 2 3 4 5
Produksi 50 70 80 85 86
(ton)
2015 80 3 4.382 0 0 0 9
21.44 0 1.2788 10 55
n X *Y * X * Y * (5)(1,2788 ) 6.394
b 0,12788
n X *2 ( X * ) 2 (5)(10) 50
b = 0,128
21,44
a Y bX 4.288
5
157
a= 4,288
ln Y 4,288 (0,128) X
Y (72,821)(1,1366 ) X
Tahun dasar adalah tahun 2015 atau pertengahan periode
21,44 15
a Y bX 0,1279 3.904
5 5
ln Y 3,904 (0,128) X
Y (49,60)(1,1366 ) X
…………….(12)
Y aecX
ln Yˆ ln a cX
ln Yˆ 3,904 0,128 X
atau
Y (49,60)e 0,128X (49,60) e 0,128
X
(49,60)(1,1366) X
jadi
158
sehingga untuk estimasi kedua persamaan dapat digunakan kedua
persamaan, ambil contoh estimasi pada tahun 2018
pertama, persamaan 12
Y (49,60)(1,1366 )6 106,93
Y (72,821)(1,1366 )3 106,94
Y AK L 1
Dimana
Y AK L
Y
AK 1L , atau
K
159
Y AK L
K K
Y Y
K K
Y K
atau
K Y
Y
Y
K
K
Jadi merupakan elastisitas yang menggambarkan persentase
perubahan ouput Y per persentase perunahan input K . Dengan kata lain
merupakan rasio pertumbuhan output Y terhadap pertumbuhan kapital K
Demikian juga untuk input L dengan mudah juga dapat dibuktikan.
Selanjutnya pada persamaan atau fungsi Cobb Douglas, jumlah dari
elassitas faktor input menunjukkan tingkat tambahan hasil (return scale)
yang berlaku sebagi berikut:
Y AL K e
ln Y ln A ln L ln K (*)
Diamna adalah suku kesalahan random (random error) atau eror saja.
Dengan memisalkan
ln Y Y *
ln K K *
160
ln L L *
Y * ln A ln L * K *
Y AX 1 1 X 2 2 X n 3 .....X n n e
n
Y A X i i e
i 1
161
varaibel independen tidak terlau tinggi seperti memperbaiki
spsesifikasi variabel yang diapakai
b. Kesalahan pengukuran variabel, hal ini terjadi bila data kurang
valid sehingga menyebabkan besaran elastisitas produksi yang
terlalu besar atau terlau kecil
c. Spesifikasi variabel yang keliru menyebabkan nilai elastisitas
produksi yang diperoleh negatif atau nilainya terlau besar atau
terlalu kecil. Spesifikasi ini akan menimbulkan terjadinya
multikolinearitas pada variabel bebas.
d. Bias terhadap variabel manajemen. Faktor manajemen merupakan
faktor penting untuk meningkatkan produksi karena berhubungan
langsung dengan variabel terikat seperti manajemen penggunaan
faktor produksi yang akan mendorong besaran elastisitas teknik dari
fungsi produksi ke arah atas. Manajemen ini berhubungan dengan
pengambilan keputusan dalam pengalokasian variabel input dan
kadang kala sulit untuk diukur dalam pendugaan fungsi Cobb-
Douglas.
Contoh Penerapan
162
7 42 25 12 3.738 3.219 2.485
Σ 37 34.7 18.29
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Dimana:
163
X1 adalah modal
Y (2.71828 ) 0.278 X 1
0.858 0.548
X2
Y 0.7573 X 1
0.858 0.548
X2
(2.71828 ) e
dimana
e = bilangan natural
Yij f ( xi , ) ij
(3)
dengan f adalah fungsi regresi dengan parameter yang harus diduga dan
ij adalah kesalahan (error) dengan sifat N(0,α). Salah satu metode
pendugaan parameter dalam sistem non-linear adalah jalan tengah
Marquardt (Marquadt’s compromise). Metode Marquardt merupakan
kompromi atau jalan tengah antara metode linearisasi atau deret Taylor
dengan metode steepest descent (Draper & Smith, 1996). Sebagai contoh
bentuk non linear paramatrik
164
Yt = 81,84 + 102,40 exp(−t/203,19) + .
Soal-soal
X 0 1 2 3 4 5 6 7 8
Y 3 9 14 16 18 17 15 12 6
ii). Y a0 a1 X a2 X 2 e
I 1 2 3 4 5 6 7 8 9 10
Xi 2 3 4 5 6 7 8 9 10 11
ei 3,2 2,9 - -2,0 - -1,2 -0,9 0,8 0,7 0,5
1,7 2,3
165
Plot residual ei dilawankan dengan Xi. Apa masalah yang
timbul dalam hal ini. Dapatkah melakukan transformasi untuk
mengatasi masalah tersebut.
I 1 2 3 4 5 6 7 8 9 10
Yi 9,9 9,3 10,2 11 16 17 15 14 10 11
Ei -1,12 2,5 -1,76 -1.5 2,53 -1,2 -0,29 3,8 -3,7 0,74
166
BAB VII
REGRESI DATA PANEL
7.1. Pendahuluan
Data panel adalah gabungan antara data runtut waktu (time series)
dan data silang (cross section). Data runtut waktu biasanya meliputi satu
objek/individu (misalnya harga saham, kurs mata uang, SBI, atau tingkat
inflasi), tetapi meliputi beberapa periode (bisa harian, bulanan, kuartalan,
atau tahunan). Data silang terdiri dari atas beberapa atau banyak objek,
sering disebut responden (misalnya perusahaan) dengan beberapa jenis data
(misalnya; laba, biaya iklan, laba ditahan, dan tingkat investasi) dalam suatu
periode waktu tertentu. Ketika suatu observasi dilakukan perilaku unit
ekonomi seperti rumah tangga, perusahaan atau Negara, kita tidak hanya
akan melakukan observasi terhadap unit-unit tersebut di dalam waktu yang
bersamaan tetapi juga perilaku unit-unit tersebut pada berabagai periode
waktu Regresi dengan menggunakan data panel disebut model regresi data
panel. Ada beberapa keuntungan yang diperoleh dengan menggunakan data
panel. Pertama, data panel merupakan gabungan data time series dan cross
section mampu menyediakan data yang lebih banyak sehingga akan
menghasilkan degree of freedom yang lebih besar. Kedua, menggabungkan
informasi dari data time series dan cross section dapat mengatasi masalah
yang timbul ketika ada masalah penghilangan variabel (omitted-variable).
Hsiao (1986), mencatat bahwa penggunaan panel data dalam
penelitian ekonomi memiliki beberapa keuntungan utama dibandingkan data
jenis cross section maupun time series.
1. Pertama, dapat memberikan peneliti jumlah pengamatan yang besar,
meningkatkan degree of freedom (derajat kebebasan), data memiliki
variabilitas yang besar dan mengurangi kolinieritas antara variabel
penjelas, di mana dapat menghasilkan estimasi ekonometri yang
efisien.
2. Kedua, panel data dapat memberikan informasi lebih banyak yang
tidak dapat diberikan hanya oleh data cross section atau time series
saja.
3. Ketiga, panel data dapat memberikan penyelesaian yang lebih baik
dalam inferensi perubahan dinamis dibandingkan data cross section.
Jadi Keuntungan yang diperoleh dengan memakai data panel :
a. Menghasilkan degree of freedom yang lebih besar.
b. Mengatasi masalah penghilangan variabel (ommited variabel)
c. Dapat mengurangi bias dalam pengestimasian karena data cukup
banyak.
d. Untuk mempelajari model perilaku individu.
e. Mempelajari perubahan yang bersifat dinamis.
167
Model Regresi Data Panel Data panel adalah data yang merupakan
hasil dari pengamatan pada beberapa individu atau (unit cross-sectional)
yang merupakan masing-masing diamati dalam beberapa periode waktu
yang berurutan (unit waktu) (Baltagi, 2005). Menurut Wanner&Pevalin
sebagaimana dikutip oleh Sembodo (2013) menyebutkan bahwa regresi
panel merupakan sekumpulan teknik untuk memodelkan pengaruh peubah
penjelas terhadap peubah respon pada data panel. Ada beberapa model
regresi panel, salah satunya adalah model dengan slope konstan dan
intercept bervariasi. Model regresi panel yang hanya dipengaruhi oleh salah
satu unit saja (unit cross-sectional atau unit waktu) disebut model komponen
satu arah, sedangkan model regresi panel yang dipengaruhi oleh kedua unit
(unit cross-sectional dan unit waktu) disebut model komponen dua arah.
Secara umum terdapat dua pendekatan yang digunakan dalam menduga
model dari data panel yaitu model tanpa pengaruh individu (common effect)
dan model dengan pengaruh individu (fixed effect dan random effect).
Menurut Jaya & Sunengsih (2009), analisis regresi data panel adalah analisis
regresi yang didasarkan pada data panel untuk mengamati hubungan antara
satu 15 variabel terikat (dependent variable) dengan satu atau lebih variabel
bebas (independent variable). Beberapa alternatif model yang dapat
diselesaikan dengan data panel yaitu,
Model regresi linier menggunakan data cross section dan time series.
a. Model dengan data cross section
Yi = α + β Xi + εi ;i = 1,2,....,N; dimana N = banyaknya data
cross section
b. Mode dengan data time series
Yt = α + β Xt + εt ; t = 1,2,....,T, dimana T = banyaknya data
time series
c. Mengingat data panel merupakan gabungan dari data cross
section dan data time series, maka modelnya dituliskan dengan:
Yit = α + β Xit + εit ;i = 1,2,....,N; t = 1,2,….., T
168
K
Yit 1it
i 1
k X kit eit (7.3)
Model 4: intercept dan slope koefisien berbeda akibat perbedaan unit cross
section.
K
Yit 1i
i 1
ki X kit eit (7.4)
Model 5: intercept dan slope koefisien berbeda akibat perbedaan unit cross
section dan berubahnya waktu.
K
Yit 1it
i 1
kit X kit eit (7.5)
Dimana:
i =1,2,…N
t =1,2,…T
N adalah banyak unit cross section
T adalah banyak data time series
Yit Nilai variabel terikat cross section ke-i time seriesnke-t
X kit Nilai variabel bebas ke-k untuk cross section ke-i tahun ke-t
it Parameter yang ditaksir
eit unsur gangguan populasi
K = Banyak parameter regresi yang ditaksir
Estimasi Regresi Data Panel Secara umum dengan menggunakan
data panel kita akan menghasilkan intersep dan slope koefisien yang
berbeda pada setiap perusahaan dan setiap periode waktu. Oleh karena itu,
di dalam mengestimasi persamaan (3) akan sangat tergantung dari asumsi
yang kita buat tentang intersep, koefisien slope dan variabel gangguannya.
Ada beberapa kemungkinan yang akan muncul, yaitu: a. Diasumsikan
intersep dan slope adalah tetap sepanjang waktu dan individu (perusahaan)
dan perbedaan intersep dan slope dijelaskan oleh variabel gangguan b.
Diasumsikan slope adalah tetap tetapi intersep berbeda antar individu c.
Diasumsikan slope tetap tetapi intersep berbeda baik antar waktu maupun
antar individu d. Diasumsikan intersep dan slope berbeda antar individu e.
Diasumsikan intersep dan slope berbeda antar waktu dan antar individu
. Pemilihan Teknik Estimasi Regresi Data Panel Seperti diketahui
terdapat tiga jenis teknik estimasi model regresi data panel, yaitu model
dengan metode OLS (common), model Fixed Effect dan model Random
Effect. Pertanyaan yang muncul adalah teknik mana yang sebaiknya dipilih
untuk regresi data panel
7.2.1.Common Effect Model (CEM)
169
metode populer untuk menduga nilai parameter dalam persamaan regresi
linear. Secara umum, persamaan modelnya dituliskan sebagai berikut
Atau
p
Yit 0 X
i 1
i pit it
Dengan asumsi:
it ~ N (0, 2 )
Dengan asumsi:
1. it ~ N (0, 2 )
2. E ( it is ) E ( it jt ) E ( it js ) 0 (i j; t s )
3. Tidak ada multikolinieritas antar variabel bebas yang digunakan,
termasuk variabel dummy
4. Kemungkinan tentang intersep, slope, dan residu pada Fixed Effect
5. Intersep dan slope tetap antar waktu dan individu, perbedaan intersep
dan slope dijelaskan oleh residualnya.
6. Slope tetap tetapi intersep berbeda antar individu
7. Slope tetap tetapi intersep berbeda antar waktu dan antar individu.
8. Intersep dan slope berbeda antar individu
170
9. Intersep dan slope berbeda antar waktu dan antar individu.
Dan
it i t it
Dimana:
171
t = Komponen error time series
i ~ N (0, 2 )
t ~ N (0, v2 )
wit ~ N (0, w2 )
var(it ) 2 2 2
Hal ini tentunya berbeda dengan Model OLS yang diterapkan pada
data panel (pooled data), yang mempunyai varian error sebesar:
var(it ) 2
OLS dapat diterapkan pada REM, namun jika tidak sama maka
perlu diestimasi dengan metode lain. Salah satu metode yang sering
digunakan dalam hal ini generalized Least square (GLS)
172
Generalized Least Square (GLS) merupakan salah satu metode
estimasi parameter yang digunakan untuk mengatasi adanya autokorelasi
apabila nilai koefisien autokorelasi diketahui. apabila nilai tidak diketahui
maka dikenal dengan Feasible Generalized Least Square (FGLS).
Yt 0 1 X t t (*)
t t 1 t ; 1 1
Yt 1 0 1 X t 1 t 1 (**)
Yt Yt 1 0 (1 ) 1 ( X t X t 1 ) t t 1
Yt* 0* 1* X t* t
Dimana :
Yt* Yt Yt 1
X t* X t X t 1
t t t 1
Pendugaan nilai
d
a. 1
2
173
b. diduga dari AR(1). Sehingga regresikan t t 1 vt
174
Model Efek Random (Random Effect) Bila pada Model Efek Tetap,
perbedaan antar-individu dan atau waktu dicerminkan lewat intercept, maka
pada Model Efek Random, perbedaam tersebut diakomodasi lewat error.
Teknik ini juga memperhitungkan bahwa error mungkin berkorelasi
sepanjang time series dan cross section.
175
( SSE1 SSE2 ) /( n 1)
F
SSS 2 /( nT n k )
Keterangan:
Dimana:
SSE1 : Sum Square Error dari model Common Effect
SSE2 : Sum Square Error dari model Fixed Effect
n : Jumlah individu (misalnya wilayah) (cross section)
T : Jumlah periode waktu
k : Jumlah variabel bebas
Ftabel [ : df (n 1, nt n k )]
Dimana:
α : Tingkat signifikasi yang dipakai (alfa)
n : Jumlah perusahaan (cross section)
nt : Jumlah cross section x jumlah time series
k : Jumlah variabel bebas
176
Fn-1,nt,n-k (ROE) = (9777,711- 973,4401) / (10 -1)
973,4401/ (10.5 - 10 – 2)
= 978,252322222
20,2800020833
= 48,237289
F-tabel = ⎨ ⍺ ; df (n-1, nT-n-k)⎬
= 5% ; (10 - 1, 10.5 - 10 - 2)
= 5% ; (9, 50 - 10 - 2)
= 5% ; (9, 48) = 2,08
Hasil dari perhitungan F-hitung didapat sebesar 48,237289 sedangkan F-
tabel dari numerator 9 dan denumenator 48 pada ⍺: 5% adalah 2,08. Dari
hipotesis diatas dapat disimpulkan bahwa H0 ditolak karena F-hitung lebih
besar dari F-tabel (48,237289 > 2,08), sehingga model yang dipakai dalam
penelitian ini adalahFixed Effect Model.
177
7.4.2. Memilih antara model Common Effects VS Random Effects
2
N
NT
i 1
(Tei ) 2
LM 1
2(T 1) N T
e 2
it
i 1 t 1
Dimana :
n = jumlah individu
T = jumlah periode waktu
e = residual metode Common Effect (OLS)
178
Kriteria pengambilan keputusan : Tolak Ho jika LM 2 ;1 atau
jika nilai P
Uji LM ini didasarkan pada distribusi chi-squares dengan degree of
freedom sebesar jumlah variabel independen. Jika nilai LM statistik lebih
besar dari nilai kritis statistik chi-squaresmaka kita menolak hipotesis nul,
yang artinya estimasi yang tepat untuk model regresi data panel adalah
metode Random Effect dari pada metode Common Effect. Sebaliknya jika
nilai LM statistik lebih kecil dari nilai statistik chi-squares sebagai nilai
kritis, maka kita menerima hipotesis nul, yang artinya estimasi yang
digunakan dalam regresi data panel adalah metode Common Effect bukan
metode Random Effect (Widarjono, 2009).
Pada kesempatan ini uji LM tidak digunakan karena pada uji Chow dan uji
Hausman menunjukan model yang paling tepat adalah Fixed Effct Model.
Uji LM dipakai manakala pada uji Chow menunjukan model yang dipakai
adalah Common Effect Model, sedangkan pada uji Hausman menunjukan
model yang paling tepat adalah Random Effect Model.Maka diperlukan uji
LM sebagai tahap akhir untuk menentukan model Common
Effect atauRandom Effect yang paling tepat.
Setelah selesai melakukan uji Chow dan didapatkan model yang tepat
adalah Fixed Effect, maka selanjutnya kita akan menguji model manakah
antara model Fixed Effect atau Random Effect yang paling tepat. Untuk
memilih model mana yang lebih cocok antara Fixed Effects ataukah
Random Effects, dapat digunakan Uji Hausman (Hausman’s Test), yaitu
sebagai berikut :
Uji Hausman
Uji ini digunakan untuk memilih model efek acak (random effect
model) dengan model efek tetap (fixed effect model). Uji ini bekerja dengan
menguji apakah terdapat hubungan antara galat pada model (galat komposit)
dengan satu atau lebih variabel penjelas (independen) dalam model.
Hipotesis awalnya adalah tidak terdapat hubungan antara galat model
dengan satu atau lebih variabel penjelas. Prosedur pengujiannya sebagai
berikut (Baltagi, 2008: 310).
Hipotesis:
179
Atau
W ( MET MEA )' [var( MET MEA )' ]1 ( MET MEA )
Keterangan:
Menurut Rosadi (2011, 274) uji ini bertujuan untuk melihat apakah
terdapat efek random di dalam panel data. Dalam perhitungan statistik Uji
Hausman diperlukan asumsi bahwa banyaknya kategori cross section lebih
besar dibandingkan jumlah variabel independen (termasuk konstanta) dalam
model. Lebih lanjut, dalam estimasi statistik Uji Hausman diperlukan
estimasi variansi cross section yang positif, yang tidak selalu dapat dipenuhi
oleh model. Apabila kondisi-kondisi ini tidak dipenuhi maka hanya dapat
digunakan model fixed effect.
Contoh Aplikasi:
lnPertum lnPengang
Provinsi Tahun X1 X2 Y lnPendidikan buhan guran
DKI 2005 10.60 6.01 15.77 2.3609 1.7934 2.7581
DKI 2006 10.80 5.95 11.40 2.3795 1.7834 2.4336
180
DKI 2007 10.80 6.44 12.57 2.3795 1.8625 2.5313
DKI 2008 10.80 6.23 12.16 2.3795 1.8294 2.4982
DKI 2009 10.90 5.02 12.15 2.3888 1.6134 2.4973
DKI 2010 10.93 6.50 11.05 2.3915 1.8718 2.4024
DKI 2011 10.95 6.71 10.80 2.3933 1.9036 2.3795
DKI 2012 10.99 6.50 9.87 2.3970 1.8718 2.2895
Jabar 2005 7.35 5.60 15.33 1.9947 1.7228 2.7298
Jabar 2006 7.50 6.02 14.59 2.0149 1.7951 2.6803
Jabar 2007 7.50 6.48 13.08 2.0149 1.8687 2.5711
Jabar 2008 7.50 6.21 12.08 2.0149 1.8262 2.4916
Jabar 2009 7.72 4.58 10.96 2.0438 1.5217 2.3943
Jabar 2010 8.02 6.20 10.33 2.0819 1.8245 2.3351
Jabar 2011 8.06 6.48 9.83 2.0869 1.8687 2.2854
Jabar 2012 8.09 6.21 9.08 2.0906 1.8262 2.2061
Jateng 2005 6.44 5.35 9.45 1.8625 1.6771 2.2460
Jateng 2006 6.80 5.33 8.02 1.9169 1.6734 2.0819
Jateng 2007 6.80 5.59 7.70 1.9169 1.7210 2.0412
Jateng 2008 6.86 5.61 7.35 1.9257 1.7246 1.9947
Jateng 2009 7.07 5.14 7.33 1.9559 1.6371 1.9920
Jateng 2010 7.24 5.84 6.21 1.9796 1.7647 1.8262
Jateng 2011 7.29 6.01 5.93 1.9865 1.7934 1.7800
Jateng 2012 7.31 6.23 5.63 1.9892 1.8294 1.7281
DIY 2005 8.38 4.73 7.59 2.1258 1.5539 2.0268
DIY 2006 8.50 3.70 6.31 2.1401 1.3083 1.8421
DIY 2007 8.59 4.31 6.10 2.1506 1.4609 1.8083
DIY 2008 8.71 5.03 5.38 2.1645 1.6154 1.6827
DIY 2009 8.78 4.43 6.00 2.1725 1.4884 1.7918
DIY 2010 9.07 4.88 5.69 2.2050 1.5851 1.7387
DIY 2011 9.20 5.16 3.97 2.2192 1.6409 1.3788
DIY 2012 9.22 5.32 3.97 2.2214 1.6715 1.3788
Jatim 2005 6.76 5.87 8.51 1.9110 1.7699 2.1412
Jatim 2006 6.90 5.80 8.19 1.9315 1.7579 2.1029
Jatim 2007 6.90 6.11 6.79 1.9315 1.8099 1.9155
Jatim 2008 6.95 6.01 6.42 1.9387 1.7934 1.8594
Common Effect
181
Fixed Effect
Random Effect
182
Membandingkan dari tiga hasil print analisis dengan menggunakan
Eviews diketahui bahwa yang paling tepat dijadikan analisa dalam
forecasting adalah Random effect. Sebab pada hasil analisis common effect
ternyata bahwa kedua variabel bebas tidak ada yang berpengaruh, walaupun
R2 cukup tinggi yakni sebesar 63,96%. Dengan demikian data kemungkinan
terjadi multicollinearity atau heteroscedasticity. Demikian juga model
Fixed Effect ternyata hampir sama keaadaannya dengan model common
effect yaitu koefisien determinasi cukup tinggi akan tetapi tidak satupun
variabel bebas yang berpengaruh secara signifikan terhadap variabel
respon. Sementara pada model ketiga diketahui bahwa variabel bebas yaitu
pertumbuhan ekonomi berpengaruh secara signifikan terhadap
pengangguran pada taraf keyakinan α = 0,05, walaupun R2 cukup rendah
hanya 14,90%. Hal ini menunjukkan masih banyaknya variabel bebas yang
dapat dimasukkan dalam model yang digunakan.
Jadi dalam hal ini, tidak perlu diuji perbandingan antara common
effect dan fixed effect dengan menggunakan Uji Hausman (Hausman’s
Test), atau common effect dan random effect dengan menggunakan Uji
Lagrange Multiplier (LM Test) karena sudah jelas model common effect
dan fixed effect bukan model yang cocok atau model yang tepat untuk
dipakai sebagai model pengangguran di wilayah pulau Jawa (kecuali
Banten).
183
Berdasarkan dari hasil pengolahan data, dan setelah
membandingkan akurasi dari ketiga model yang ada maka model dapat
dinyatakan sebagai:
Dimana:
184
BAB VIII
REGRESI DENGAN VARIABEL DUMMY
8.1. Pendahuluan
185
Variabel dummy independen yang dikotomis ( dua kategori ) bersifat saling
bebas (mutually exclusive), yang menunjunkkan jenis kelamin (misalnya
pegawai pria diberi nilai 1 dan wanita, 0) dan wilayah (misalnya kota diberi
nilai 1 dan desa 0), secara matematis ditulis
1. X1 Y
X2 Y
X1
2. Y bagaimana?
X2
3. X1 Y1
Bandingkan pengaruh X1 terhadap Y1 dan
pengaruh X2 terhadap Y2
X2 Y2
186
Perbandingan pada nomor 3 tentu tidal dapat dialkukan sebab dua
yang diabndingkan dan dua pembandingnya.
Suatu regresi bisa saja terdiri dari variabel bebasnya ada yang
bersifat dikotomi atau binary, bahkan variabel tak bebasnya bersifat binary
atau kualitatif. Pada sub bab ini, akan dijelaskan regresi linear yang
memiliki variabel dummy dengan yang paling sederhana adalah
regresi linear yang mengandung satu variable bebas dan satu variable
dummy, bahkan ada regresi yang terdiri dari variabel bebasnya berupa
dummy saja dan di sini tidak akan dibahas. Sebelum melakukan analisis
lebih lanjut diberikan beberapa asumsi untuk regresi dengan variabel bebas
dummy sebagai:
Ketentuan
Y konstan X D1 D2
Pengrajin konveksi Y1 1 X1 1 0
Pengrajin konveksi Y2 1 X2 1 0
187
Pengrajin Besi Y3 1 X3 0 1
Pengrajin konveksi Y4 1 X4 1 0
Pengrajin besi Y5 1 X5 0 1
D1 = 1 - D1
D2 = 1 - D2
Y 0 1 Lt 2 D1 3 D2
Dengan model
Y 0 1 X 2 D 3 DX e
ln Y 0 1 ln X 2 D 3 D ln X e
atau
ln Yˆ 0,643 1,289 ln X
ln Yˆ 0,643 1,177 ln X
189
diterapkan atau diaplikasikan dalam dunia bisnis dan ekonomi, karena
secara statistik seluruh koefisien yang diberikan semuanya signifikan
0,01 . Tetapi ternyata ditempat lain dengan pengusaha yang sama justru
menunjukkan keadaan yang sebaliknya justru variabel predictor DX tidak
memiliki pengaruh secara statistik, sehingga persamaan yang ditemukan
adalah:
ln Yˆ 1,565 0,723 DX
ln Yˆ 0,223
190
(a) (b)
lnY lnY
D=1
D=1
D=0
α+β D=0
α α
lnX lnX
Terlihat bahwa efek utama dari tenaga kerja dan musim adalah
marginal terhadap interaksi antara tenaga kerja dan musim. Jelas terlihat
bahwa pada gambar (a) dengan intercept yang sama tidak adanya pengaruh
variabel X, sedang pada gambar (b) mengindikasikan pelanggaran dari
prinsip marginalitas. Artinya diharapkan terjadinya perbedaan antara
intercept pada gambar a) dan b terjadinya perbedaan koefisien atau
pengaruh dari akibat adanya interaksi antara musim dan tenaga kerja. Pada
umumnya kita tidak menguji dan tidak menginterpretasikan efek utama
dari variabel-variabel yang berinteraksi (Fox, 2010)
Jadi jika menyusun suatu interaksi baik secara teori maupun secara
empiris, dan interaksi tersebut dapat dites, diestimasi dan diinterpretasi efek
utamanya, maka pada umumnya hal tersebut tidak berarti model dapat
dispsesifikasi dan menyesuaikan dengan model yang memuat regressor
interaksi tetapi menghapus efek utama yang marginal terhadap model
tersebut. Model-model yang melanggar prinsip marginalitas itu jelas dapat
diinterpretasi (interpretable) tetapi tidak umum diaplikasikan.
191
8.2. Regresi Linear dengan Variabel Dummy
1 ; wilayah kota
D
0 ; wilayah desa
Sehingga persamaan regresi menjadi :
Ct = 0 + 1 Yt + 2 D + e …….(8.1)
Dimana:
Ct adalah Konsumsi pada tahun ke t
Yt adalah pendapatan pada tahun ke t
D adalah wilayah (D=0, Desa dan D=1, Kota)
Ct = 0 + 1 Yt + e
Ct = ( 0 + 2 ) + 1 Yt + e
Ct
Ct = ( 0 + 2 ) + 1 Yt + e , kota
0 + 2
0 Ct = 0 + 1 Yt + e , desa
Yt
192
Selanjutnya persamaan regresi dengan dua variabel bebas dan satu
variabel dummy dapat dinyatakan sebagai berikut:
Ct = 0 + 1 Yt + 2 Pt + 3 D + e
Dimana:
Ct Konsumsi pada tahun ke t
Yt adalah pendapatan pada tahun ke t
Pt adalah harga pada tahun ke t
D adalah wilayah (D=0, kota dan D= 1, desa)
Wilayah kota, D= 0
Ct = 0 + 1 Yt + 2 Pt + e
Masa OTDA D= 1
Ct = ( 0 + 3 ) + 1 Yt + 2 Pt + e
Ct = 0 + 1 Yt + 2 Dt + e
Ct = 0 + 1 Yt + 2 Dt + 3 Dt Yt + e ….. (5)
193
Persamaan Regresi untuk Desa, D = 0
C = 0 + 1 Y + e
C = ( 0 + 2 ) + ( 1 + 3 ) Y + e
C = ( 0 + 2 ) + ( 1 + 3 )Y + e
0 + 2
0 Ct = 0 + 1 Yt + e
Yt
Contoh aplikasi:
Seorang peneliti ingin mengetahui perbandingan kecenderungan
mengkonsumsi (MPC) dari suatu masyarakat yang terdiri dari pengusaha
dan bukan pengusaha. Data konsumsi diberi simbol C (ribuan rupiah/hari,)
pendapatan Y (ribuan rupiah/hari) dan pekerjaan D, seperti yang tertera pada
Tabel 8.2
Jawab:
194
Tabel 8.2 Konsumsi dan Pendapatan Masyarakat
Konsumsi Pendapatan
D (C) (Y) D DY
35 48 1 48
24 28 1 28
25 35 1 35
Pengusaha
12 13 1 13
23 25 1 25
17 18 1 18
16 17 1 17
3 4 0 0
4 6 0 0
5 7 0 0
6 8 0 0
Non pengusaha
3 5 0 0
7 17 0 0
3 6 0 0
4 7 0 0
7 9 0 0
195
Coefficientsa
Standardized Collinearity
Unstandardized Coefficients Coefficients Statistics
R = 0,993
R 2 = 0,986
196
Cˆ 2 2,02 0,34 Y
Ct = 0 + 1 Yt + 2 Pt + 3 D + 4 DYt + 5 DPt + e
Musim hujan, D = 0
Ct = 0 + 1 Yt + 2 Pt + e
Musim kemarau, D= 1
Ct = ( 0 + 3 ) + ( 1 + 4 ) Yt + ( 2 + 5 ) Pt + e
197
Contoh Data Hipotetis:
C Y P D DY DP
86 98 5,33 0 0 0
96 104 5,5 0 0 0
103 179 5 0 0 0
116 156 6 0 0 0
------------------------------------------------------------------
Keterangan:
C= konsumsi madu
Y= Pendapatan
P = harga
D = 0,musim hujan
198
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
a. Dependent Variable: C
R 2 = 0,997
R = 0,998
199
Cˆ1 137,26 0,57 Y 17,28P
dimana:
Q = produksi
L = tenaga kerja
Anggaplah terdapat dua jenis petani, katakanlah petani rumput laut laki-laki
dengan D=1 dan petani rumput laut perempuan dengan D=0.
200
atau
Q aL1 eu
Sedang persamaan regresi non linear petani untuk laki-laki dengan D=1,
Q (ae 2 ) L( 1 3 )eu
37 6 3.61 1.79 0 0
54 9 3.99 2.2 0 0
67 9 4.2 2.2 0 0
38 8 3.64 2.08 0 0
27 6 3.3 1.79 0 0
38 8 3.64 2.08 0 0
201
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
R = 0,934
R 2 = 0,871
ln Q 3,477 0,366 ln L
202
Dikembalikan dalam bentuk asli (non linear)
Q 32,35 L 0,366
Dimana:
32,35 adalah hasil dari anti ln3,477 atau 32,35 (2,718)3,477
ln Q 0,878 1,410 ln L
Atau
Q 2,41 L 1,41
203
8.4. Pengembangan Regresi dengan variabel Dummy
+ …………………………………… (2)
Dimana:
Y = konsumsi listrik di Kalimantan Timur (MWh)
X = PDRB dengan harga berlaku (trilyun rupiah)
Di = Dummy variable ( variabel boneka), i = 1,2,3,4
Kelompok
Konsumsi listrik Rumah tangga
Konsumsi listrik Usaha
Konsumsi listrik untuk Industri
Konsumsi listrik untuk Umum
1. Persamaam Regresi untuk Rumah Tangga
204
Y = (a0 + a2) + (a1 +a5) X1 + …………………………….. (3)
D1 = 0
D2 = 0
D3 = 0
Y = a0 + a1 X1 + ………………………………………….(6)
8.4.2. Persamaan Regresi Dua Variabel Bebas dan Tiga Variabel Dummy
205
Y= a0 + a1X1+ a2X2 + a3D1 + a4D2 + a5D3 + a6D1X1 + a7D2X1 +
a8D3X1 + a9D1X2 + a10D2X2 + a11D3X2 + ……………………
(2)
Dimana:
Y = konsumsi listrik di Kalimantan Timur (MWh)
X1 = jumlah penduduk ( juta orang)
X2 = PDRB dengan harga berlaku (trilyun rupiah)
Di = Dummy variable ( variabel boneka), i = 1,2,3
D1 = 0
D2 = 0
D3 = 0
Y = a0 + a1 X1 + a2X2 + …………………………………….(6)
206
Tabel 8.3. Perkembangan Ekonomi dan Laju Pertumbuhan
PDRB Kalimantan Timur, Tahun 1993 - 2003
Tabel 8.4. Tenaga Listrik yang Terjual Menurut jenis Pelanggan (MWH)
Tangga
207
Hasil Penelitian dan Pembahasan
Penelitian mengkaji secara mendalam hubungan antara jumlah
penduduk dan PDRB dengan konsumsi listrik. Dengan menggunakan
kemasan paket Program SPSS (Statistical Program for Social Science)
diperoleh Persamaan Regresi Linear Berganda dengan variabel boneka
sebagai
208
(Angka-angka dalam kurung, atas menunjukkan t hitung dan bawah
signifikansi).
R 2 = 0,990
R = 0,995
Y = 0,056 + 0,0017 X2
……………………………………………..(10)
Sig. (0,000) (0,048)
D1 = 0
209
D2 = 0
D3 = 0
Soal A.
Soal B.
1. Apa yang dimaksud variabel boneka. Bedakah dengan variabel
dikotomi. Jelaskan
2. Kapan dan bagaimanakah menggunakan Regresi dengan variabel
dummy.
45 56
86 98
96 104
103 179
116 156
132 176
242 298
248 354
210
258 318
267 338
269 396
272 571
----------------------------------------------------------------
Y = Pendapatan
86 98 42
96 104 42
116 156 44
132 176 44
211
258 318 45
267 338 45
269 396 50
272 571 50
Pertanyaan
212
BAB IX
9.1. Pendahuluan
213
2. Varian kesalahan pengganggu heteroskedastik.
3. Probabilitas bersyarat yang ditaksir mungkin tidak terletak antara 0
dan 1 artinya bisa lebih kecil dari nol (negatif) atau lebih besar dari
satu.
Masalah pertama tidak serius, karena penggunaan OLS masih menghasilkan
penaksiran tak bias. Untuk sampel yang besar masih bisa melakukan
pengujian hipotesis. Masalah kedua dapat ditangani dengan
mentransformasikan data. Masalah yang serius adalah masalah probabilitas
bersyarat yang ditaksir mungkin tidak terletak antara 0 dan 1. Masalah ini
dapat dipecahkan dengan suatu teknik yang menjamin bahwa nilai
probabilitas akan terletak antara 0 dan 1.
Model Regresi dengan variabel dummy yang telah diuraikan
terdahulu adalah memiliki sifat bahwa variabel bebasnya (dummy)
adalah kualitatif. Namun pada pembahasan ini model regresi dimana
variabel tak bebasnya bersifat kualitatif atau dikotomi yang bernilai 1
atau 0. Misalkan suatu studi tentang tingkat partisipasi kerja yang
merupakan fungsi dari tingkat pengangguran, tingkat upah dan
pendapatan keluarga. Dalam hal terdapat orang yang bekerja dan yang
tidak bekerja, sehingga partisipasi kerja merupakan variabel tak bebas
yang hanya memiliki nilai 1 dan 0. Ciri has dari responden dalam
hal ini adalah menjawab pertanyaan ya atau tidak, jadi bersifat
dikotomi. Mempelajari model regresi yang mengandung variabel tak
bebas yang bersifat kualitatif, perlu dilakukan formulasi bentuk model
yang akan ditaksir. Dalam teori ekonometrik, terdapat tiga model regresi
linear dengan variabel dependent bersifat kualitatif, yaitu: 1. The linear
probability model (LPM), 2. The logit model dan 3. The probit model (
Arief, 1993).
Yi 0 1 X i i ……………………………… (5.1)
Dimana:
214
Asumsikan E ( i ) 0 , sebagaimana biasanya (untuk mendapatkan
estimator yang tak bias) kita peroleh:
E (Yi ) 0 1 X i
Yi Probalitas
0 1- Pi
1 Pi
Total 1
E (Yi ) 0(1 Pi ) 1( Pi ) = Pi
Dengan demikian
0 E (Yi ) 1
Contoh:
215
1 0 58
2 1 116
3 1 118
4 0 7
5 0 25
6 1 119
7 1 120
8 0 83
9 0 39
10 0 40
11 1 117
12 1 118
13 0 74
14 1 120
15 0 36
16 1 119
17 1 116
18 0 30
19 0 78
20 1 118
216
SE ; (0,118) (0,001)
T; (-3,793) (8,908)
R 2 0,815
217
pengujian. Untuk pengujian multikolinearitas ini dapat digunakan uji
kesesuaian (goodness of fit test) yang kemudian dilanjutkan dengan
pengujian hipotesis guna melihat variabel bebas mana saja yang signifikan
dan dapat tetap digunakan dalam penelitian.
218
Gambar 9.2. Fungsi Logistik dengan β0+ β1X pada sumbu horizontal
1. Hubungan linear yang terdapat pada regresi liner, tidak dapat terjadi
pada regresi logistik, sehingga Regresi logistik tidak mengasumsikan
hubungan linear antara variabel bebas dan variabel tak bebas
2. Variabel tak bebas harus berupa dikotomi (dua kategori)
3. Variabel bebas tidak mesti memiliki skala interval dan tidak perlu
terdistribusi normal (multivariate normality), tidak juga harus ada
hubungan linear dan tidak juga harus memilki kesamaan variance
(asumsi homoscedasticity)
4. Kelompok atau kategori-kategori yang ada harus bebas sama lain
(mutually exclusive). Jika studi satu kelompok, maka setiap kasus atau
item harus berasal dari kelompok tersebut.
5. Sampel yang diperlukan dalam jumlah relatif besar, minimum
dibutuhkan hingga 50 sampel data untuk sebuah variabel bebas
(independen).
6. Dapat menyeleksi hubungan karena menggunakan pendekatan non
linier log transformasi untuk memprediksi odds ratio. Odd dalam
regresi logistik sering dinyatakan sebagai probabilitas.
219
Pi E (Y 1 / X i ) 0 1 X i ………….. (9.1)
Dimana:
Y = kepemilikan rumah
X = pendapatan
1
Pi E (Y 1 / X i ) ( o 1 X ) ………….. (9.2)
1 e
e 2,7183
1
Pi ………….. (9.3)
1 e Zi
Dimana
Z i 0 1 X i
1
1 Pi ………….. (9.4)
1 e Zi
220
Jika probabilitas kepemilikan mobil dibagi dengan probabilitas tidak
memiliki mobil, maka odd ratio (OR) dinyatakan
Pi 1 e Zi
= e Zi …….. (9.5)
1 Pi 1 e Zi
Pi
Li ln Zi
1 Pi
0 1 X i
Pi
Atau ln 0 1 X i (9.6)
1 Pi
Pi X
e 0 1 i ………….. (9.7)
1 Pi
Pi
disebut Odd Ratio (OR)
1 Pi
Persamaan (9.6), dapat ditulis dengan logit ( Pi )
Sehingga
P
logit ( Pi ) ln i 0 1 X i Z i
1 - Pi
Jadi model logit dinyatakan dalam suatu bentuk model probabilistic atau
dengan mengambil inversnya, yaitu probabilitas yang dinyatakan dengan
logit sehingga dapat ditulis:
logit
e 1 1
Pi 1
logit logit -logit
1 e 1 e 1 e
221
Atau
1 1
Pi , sama dengan persamaan (9.2).
1 e -z -( X )
1 e 0 1
P(Y 1 / X 1) 1
Odd utk memiliki mobil e 0
p 0 1X 1 P(Y 1 / X 1)
e
1 p Odd utk tidak memiliki terjadi
P(Y 1 / X 0)
e 0
1 P(Y 1 / X 0)
1
Odd utk even yang terjadi e 0 ……(9.10)
OR e 1
Odd utk even yang tidak terjadi 0
e
Bentuk umum :
Pi
Li = ln( ) 0 1 X 1 2 X 2 ....... n X n i (5.9)
1 Pi
Dimana:
222
n
l ( ) p( xi ) yi {1 p( xi )}1 yi ……(9.2)
i 1
yi adalah pengamatan pada variabel respons ke-i
(xi) adalah peluang untuk variabel predictor ke-i
Jika ruas kiri dan kanan dari persamaan 9.2 dilogaritmakan diperoleh:
n
ln[ l ( )] ln[ p( xi ) yi {1 p( xi )}1 yi ]
i 1
n
ln[ l ( )] ln[ p( xi ) yi {1 p( xi )}1 yi ]
i 1
n
ln[ p( xi ) yi {1 p( xi )}1 yi ]
i 1
n n
yi ln[ p( xi )] (1 yi ) ln[1 p( xi )]
i 1 i 1
n n
yi ln[ p( xi )] (1 yi ) ln[1 p( xi )]
i 1 i 1
n n
yi ln[ p( xi )] (1 yi ) ln[1 p( xi )]
i 1 i 1
Atau dapat ditulis
n n
ln l ( ) yi ln[ p( xi )] (n yi ) ln[1 p( xi )] …… (9.7)
i 1 i 1
n n
d ln l ( ) i 1 yi n yi
i 1
(1)
d p ( xi ) 1 p ( xi )
Jadi
223
n n
yi n yi
i 1
i 1
0
p ( xi ) 1 p ( xi )
n n
yi n yi
i 1
i 1
0
p ( xi ) 1 p ( xi )
n n
yi (1 p( xi ) p( xi )(n yi )
i 1 i 1
0
p ( xi )(1 p ( xi )
n n n
i
y
i 1
p ( xi i
) y np ( xi )
i 1
p ( xi yi 0
)
i 1
n
y np( x ) 0
i 1
i i
y i
i 1
y p( xi )
n
Alat yang digunakan untuk menguji kecocokan model dalam regresi logistik
adalah uji Hosmer-Lemeshow. Statistik Hosmer-Lemeshow mengikuti
distribusi Chi-square dengan df = g − 2 dimana g adalah banyaknya
kelompok, dengan rumus sebagai berikut:
224
g
(Oi N i i ) 2
HL
2
i 1 N i i (1 i )
dimana:
Ni : Total frekuensi pengamatan kelompok ke-i
Oi : Frekuensi pengamatan kelompok ke-i
i : Rata-rata taksiran peluang kelompok ke-i
Untuk menguji kecocokan model, nilai Chi-square yang diperoleh
dibandingkan dengan nilai Chi-square pada table Chi-square dengan df = (g
– 2). Jika HL
2
(2g 2) maka H0 ditolak dan H1 diterima
l
G 2 log 0 2[log(l0 ) log(l1 )] 2( L0 L1 )
l1
l0 = nilai maksimum fungsi kemungkinan untuk model di bawah hipotesis
nol
l1 = nilai maksimum fungsi kemungkinan untuk model di bawah hipotesis
alternatif
L0 = nilai maksimum fungsi log kemungkinan untuk model di bawah
hipotesis nol
L1 = nilai maksimum fungsi log kemungkinan untuk model di bawah
hipotesis alternatif
225
mengetahui pengaruh masing-masing parameter tersebut. Uji signifikansi
parameter model secara terpisah (parsial) dilakukan untuk mengetahui
signifikansi parameter terhadap variabel dependen. Selanjutnya untuk
mengetahui signifikansi parameter model secara terpisah adalah dengan
menggunakan uji Wald (Hosmer dan Lemeshow, 2000) dengan hipotesis
sebagai berikut :
H0 : βi 0
H0 : βi 0 , i = 1,2,3……p
i
SU : W 2
SE( i )
1 22 0 14 40 0 27 60 0
2 23 0 15 41 1 28 62 1
3 24 1 16 45 0 29 66 1
4 25 0 17 46 1 30 67 1
5 27 0 18 47 1 31 68 1
6 28 0 19 48 0 32 69 0
7 30 0 20 49 1 33 70 1
8 31 0 21 49 0 34 73 1
9 32 0 22 50 1 35 75 0
10 33 1 23 51 0 36 78 1
11 35 0 24 58 1 37 80 1
12 37 0 25 58 0 38 88 0
13 38 1 26 59 1 39 89 1
226
Nilai kuadrat W tersebut mengikuti distribusi Chi-square dengan df = 1. Jika
W2 ≥ 2(1 ) atau p-value ≤ α maka H0 ditolak, dan H1 diterima. i adalah
nilai dari estimasi parameter regresi dan SE ( i ) adalah standard error ke-
i.
n
Pˆi i
Ni
Rumah ln T.Tengah
Pˆ
ˆ ln(
L i
) 0 1 X i
i
1 P ˆ
i
227
Menggunakan metode OLS dengan bantuan Program SPSS diperoleh:
p
ln 2,212 0,042 X i
1 p
p 2,212 0,042X
e i
1 p
2,212 0,042X
p
e i e 2,212 e0,042 , utk x 1
1 p
Orang dengan umur lebih tua satu tahun akan memiliki pelung 1,04 kali
untuk memiliki rumah dibanding yang lebih mudah satu tahun, dapat
dikatakan: semakin tinggi usia semakin besar peluang untuk memiliki
rumah.
228
dan koefisien tersebut disebut odd ratio. Misalkan diketahui dari print out
komputer:
229
Dari tabel yang sama diketahui bahwa pendidikan memberikan pengaruh
positif terhadap kemiskinan, atau jika pendidikan naik satu persen maka
odd rasio kemiskinan naik 322 (4,227-1) %. Jelasnya orang yang memiliki
pendidikan lebih tinggi satu strata memiliki peluang menjadi kaya 4,227
kali dibanding yang memilki pendidikan kurang satu strata.
sehingga diperoleh
P e 11,3141, 441
11, 314
e1, 441 = 4,225
1 P e
Peluang orang sehat menjadi tidak miskin jauh lebih tinggi dari
pada peluang orang sakit, atau lebih empat kali dari orang sakit
231
Pengembalian 19.390 10152.758 .000 1 .998 2.636E8
P
ln 33,36 0,92 X 1 0,10 X 2 0,83 X 3 0,03 X 4 0,56 X 5 0,22 X 6 0.61X 7 19,39 X 8
1 P
232
nasabah menyebabkan peningkatan kemampuan bayar zakat yang lebih
rendah. Demikian juga untuk pengetahuan bisnis pada taraf keyakinan α =
0,10 memberikan pengaruh terhadap kemampuan bayar zakat. Koefisien
regresi logistik, 0,83 dengan nilai Odd Raio sebesar 2,28 menunjukkan
bahwa peningkatan pengetahuan bisnis 1 % akan menyebabkan
peningkatan kemampuan bayar zakat sebesar 1,27%. Selanjutnya variabel
pendidikan tidak memberikan pengaruh terhadap kemampuan membayar
zakat.
Variabel lama usaha memberikan pengaruh positif terhadap
kemampuan bayar zakat pada taraf keyakinan α = 0,10 . Odd Rasio
sebesar 1,75 menunjukkan bahwa setiap peningkatan lama usaha 1%
akan menyebabkan peningkatan kemampuan bayar zakat sebesar 1,75– 1
= 0,75 atau 0,75. Jadi peningkatan lama usaha lebih tinggi dibanding
dengan peningkatan tingkat kemampuan bayar zakat, jika terjadi perubahan.
Variabel lama pinjaman tidak memerikan pengaruh terhadap kemampuan
membayar zakat pada taraf keyakinan α = 0,10. Demikian pula variabel
berzakat dan Pengembalian Pinjaman tidak memberikan pengaruh yang
signifikan terhadap kemampuan membayar zakat, namun pengaruh
keduanya tidak signifikan pada α= 0,10.
Latihan
Soal-soal
1. Lengkapi Tabel berikut:
Pi
Pdptan (Ni) ni Pi Li= ln wi = NiPi(1-Pi) L* = Li wi
1 Pi
X i* X i wi
Xi
(000 $)
6 40 8 0,20
8 50 12 0,24
10 60 18 0,30
13 80 28 0,35
15 100 45 0,45
20 70 36 0,51
25 65 39 0,60
30 50 33 0,66
35 40 30 0,75
40 25 20 0,80
_____________________________________________________________
233
Student Number Tes Admitted to
graduate
program
Quantitative Verbal Yes=1; No
(Q) V =0
1 760 550 1
2 600 350 0
3 720 320 0
4 710 630 1
5 530 430 0
6 650 570 0
7 800 500 1
8 650 680 1
9 520 660 0
10 800 250 0
11 670 480 0
12 670 520 1
13 780 710 1
3. Selesaikan selengkapnya
Pendu. Pendapatan
miskin (000Rp)
0 490
1 1800
0 1500
1 1750
234
1 1250
0 490
1 1500
1 1700
0 430
0 500
1 1490
a. Analisis data di atas dengan tiga metode (variabel bebas adalah wolf
density):
(i) Regresi linear sederhana
(ii) Regresi non linear kuadratik
(iii) Regresi logistik
Jawaban:
235
Sumber : Bergerud, 1996.
236
BAB X
REGRESI LINEAR MULTIVARIAT
10.1. Pendahuluan
Regresi linear multivaraiate (multivariate Linear Regression) adalah
model regresi linear yang memiliki dua atau lebih dari variabel tak bebas
dengan satu atau lebih variabel bebas. Jadi model ini adalah salah satu dari
sekian banyak pengembangan regresi linear sederhana atau berganda. Jadi
suatu Analisis yang merupakan analisis lanjutan dari analisis univariat
maupun bivariat. Analisis regresi linier multivariate adalah model regresi
linier dengan dua atau lebih variabel respons yang saling berkorelasi dan
beberapa variabel prediktor. Analisis regresi linier univariat diasumsikan
bahwa variabel respons adalah saling bebas, sedangkan pada analisis regresi
linier multivariat mempertimbangkan adanya hubungan ketergantungan di
antara variabel respon. Pada analisis regresi linier multivariat pemilihan
model terbaik merupakan hal yang penting.
Johnson dan Wichern, 1998; Rencher, 2002) menyatakan bahwa
Model regresi multivariat adalah model regresi dengan lebih dari satu
variabel respon yang saling berkorelasi dan satu atau lebih variabel
predictor. Secara ilmiah, untuk menjelaskan fenomena sosial perlu
dilakukan percobaan dengan pengumpulan dan analisis data. Analisis data
yang dikumpulkan dari pengamatan atau percobaan akan menghasilkan
modifikasi penjelasan dari phenomena tersebut. Selama dalam masa
percobaan tersebut, sering kali akan terjadi penambahan dan pengurangan
variabel. Dengan demikian, maka akan timbullah masalah yang semakin
kompleks sehingga dibutuhkan lebih banyak variabel yang berbeda. Karena
dalam data akan terdapat pengaruh beberapa variabel terhadap variabel
lainnya dalam waktu yang bersamaan.
Regresi linier multivariat adalah model regresi linier dengan
beberapa variabel respon yang saling berkorelasi dan beberapa variabel
prediktor dan diasumsikan adanya hubungan ketergantungan di antara
variabel respon Y. Pada analisis regresi linier multivariat pemilihan model
terbaik merupakan hal yang penting. Hal ini dikarenakan pemilihan model
terbaik pada analisis regresi linier multivariat tergantung banyaknya variabel
prediktor yang terlibat dalam model. Pemilihan model terbaik pada analisis
regresi linier multivariat tergantung banyaknya variabel prediktor yang
terlibat dalam model. Terdapat beberapa kriteria dalam pemilihan model
terbaik salah satunya adalah kriteria AICC (Corrected Akaike Information
Criterion ) yang merupakan pengembangan dari AIC (Akaike information
criterion). AICC akan menghasilkan model terbaik jika digunakan pada data
ukuran sampel yang kecil. AICC dan AIC dapat dilihat secara jelas pada
AICC Wikipedia.
237
10.2. Model Linear Multivariat
Adapun model linear multivariate mengakomodasi dua atau lebih
variabel respons atau variabel terikat dengan model umum persamaan
Regresi Linear Multivariat dapat dinyatakan:
Y1 01 11 X 1 21 X 2 31 X 3 .... k1 X k 1
Y2 02 12 X 1 22 X 2 32 X 3 .... k 2 X k 2
. .
. .
Yp 0 p 1 p X 1 2 p X 2 3 p X 3 .... kp X k p
E ( i ) 0 Cov( i , k ) ik I
, , i, k=1,2,…,p. dimana I adalah
identitas matriks atau ( 1 , 2 , 3 ...., p ) t memiliki nilai ekspektasi 0 and
variance matrix nxp
Var ( i ) serta
t ( β̂) t ( β̂)
Dimana:
Y adalah suatu matriks dengan n observasi pada p variabel respons.
X adalah matriks desain dengan kolom untuk k+ 1 regressor atau
variabel independen, dalam bentuknya angka 1 pada kolom pertama
untuk konstan regresi;
B adalah matriks koefisien regresi dengan satu kolom untuk setiap
variabel respons; dan
E adalah matriks kesalahan pengganggu.
238
Model (10.1) menunjukkan atau bersesuaian di Regresi, dimana
bagian sebelah kiri terdiri dari matrix variabel respons sedang bagian
sebelah kanan adalah matrix yang menunjukkan model linear univariate
(variabel respons tunggal), Fox and Weisberg (2011). Sama dengan regresi
lainnya, asumsi model regresi liner multivariate dihubungkan dengan
kesalahan penggangu.
Misalkan it menyatakan baris ke-i dari E, maka it ∼ Nm(0, Σ),
dimana Σ adalah matriks kesalahan kovarians nonsingular; sedang it
dan tj saling bebas untuk i ≠ j .Secara lengkap dapat ditulis sebagai vec
∼ nm 0, n dan n adalah matriks identitas, sedang operator
perkalian Kronecker (Fox dan Weisberg, 2011).
Selanjutnya untuk mengestimasi koefisien regresi estimator
maximum-likelihood B dalam model multivariate linear adalah equivalent
dengan beberapa kuadrat terkecil dari variabel respons individual, sehingga
koefisien diperoleh melalui perkalian matriks
β̂ (X t X) 1 Xt Y ……………(10.2)
Misalkan dimiliki sampel dengan ukuran n, sehingga matriks desain X
memiliki ordo n (k+1), dimana (k+1) adalah rank dari matriks X, sehingga
secara simbolis dapat ditulis
01 02 ... 0 m
12 ... 1m
( k 1)m 11
(1) ( 2) .. ( m )
k1 k 2 ... km
(i ) adalah regresi (k+1) dalam model untuk variabel yang ke-i. Vektor
demensial pn adalah vektor kesalahan (i ) 1,2,… p yang juga ada pada
Matriks yang berukuran nxp.
01 02 ... 0 p 1t
t
12 ... 1 p
( nxp)
..
11
.. ... ..
(1) ( 2) ... e( p ) 2
..
t
n1 n 2 ... np p
( j ) ij
239
Untuk i respon, maka modelnya mengikuti :
Dengan:
01 02 ... 0 q
11
0T 12 1q
1
p1 p2 pq
t t t
t
ny y t
dan
̂ t t ny y t
240
Pengujian kebebasan Antar Variabel Respon
Untuk menguji kebebasan antar variabel respon dapat dilakukan uji Bartlett
Sphericity berikut (Morrison, 2005):
Hipotesis :
H0 : Antar variabel respon bersifat independen
H1 : Antar variabel respon bersifat dependen
Statistik Uji:
2q 5
2hitung n 1 ln R
6
2 1
241
H 0 : i 0
ˆ ' '
'
' ny y '
ˆ ' ˆ
Dimana
ˆ ˆ
dan
ˆ 'ˆ ny y '
H0 : 1 2 ... k
242
2(1 c1 ) ln M
k k
1 1
ln M i ln S i i ln S
2 i 1
2 i 1
vS
i 1
i
S k
v
i 1
i
k
1 2 p2 3 p 1
1
c1
k
1 6( p 1)( k 1) , vi ni 1
vi
i 1
v
i 1 i
Dimana:
k = banyaknya kelompok ( grup )
p = jumlah peubah pembeda (Y) dalam fungsi diskriminan = 1
S = matriks varians kovarians dalam kelompok gabungan.
Si = matriks varians kovarians kelompok ke-i.
i = 1,2, ... , k
Terima hipotesis nol jika ,(1/ 2)(k 1) p( p 1) yang berarti matriks
2
Uji Hipotesis
243
Hipotesis menyatakakan bahwa varaibel respons tidak bergantun X q1 ,
X q2 ,…… X p , sehingga
H0 : ( 2 ) 0 dimana
(1)
(( q 1) p )
( 2) , sedang
((k q ) p )
X X2
X 1
(n (q 1)) (n (k q))
Sehingga secara umum model dapat dinyatakan
(1)
E (Y ) X [ X 1 X 2 ] X 1 (1) X 2 ( 2 )
( 2)
H0 : ( 2 ) 0 dimana
(1)
(( q 1) p )
( 2) , sedang
((k q ) p )
X X2
X 1
(n (q 1)) (n (k q))
Sehingga secara umum model dapat dinyatakan
244
(1)
E (Y ) X [ X 1 X 2 ] X 1 (1) X 2 ( 2 )
( 2)
H0 : (1) 0 , Y X1(1)
jumlah kuadrat ekstra dan cossproducts
Dimana:
Statistik Uji:
2q 5 2(2) 5
2hitung n 1 ln R 8 1 ln 0.68 2.12
6 6
245
Uji Asumsi Residual Identik
Asumsi selanjutnya yang harus dipenuhi dalam pemodelan secara
multivariat adalah matriks varians-kovarians residual homogen. Pengujian
dilakukan terhadap nilai dari residual dengan hipotesis sebagai
berikut:Untuk menguji syarat ini dapat dipergunakan statistik uji Box’s M.
Hipotesis
H0 : 1 2
2(1 c1 ) ln M
k k
1 1
ln M i ln Si i ln S pool
2 i 1
2 i 1
k
1 2 p2 3 p 1
1
c1
k
1 6( p 1)( k 1) , vi ni 1
vi
i 1
v
i 1 i
Terima hipotesis nol jika ,(1/ 2)(k 1) p( p 1) yang berarti
2
Contoh:
Anggaplah bahwa investasi dan upah memiliki pengaruh terhadap
pendidikan dan kesehatan dengan data sebagai berikut:
246
No. Investasi Upah Pendidikan Kesehatan
1 4 3 1 2
2 3 4 2 3
3 4 6 4 2
4 1 7 3 4
5 2 6 5 2
6 5 7 4 5
7 8 5 5 6
8 9 7 8 7
Matriks Desain:
1 4 3
1 3 4
1 4 6
X
1 1 7
1 2 6
1 5 7
1 8 5
1 9 7
1 4 3
1 3 4
1 4 6
1 1 1 1 1 1 1 1 8 36 45
X T X 4 3 4 1 2 5 8 9
1 7
36 216 205
1
1 2 6
3 4 6 7 6 7 5 7 45 205 269
1 5 7
1 8 5
1 9 7
Sehingga diperoleh
dan
247
1
2
4
1 1 1 1 1 1 1 1 32
4 3 4 1 2 5 8 9 171
3
X T Y(1)
5
3 4 6 7 6 7 5 7 195
4
5
8
Sehingga:
2
3
2
1 1 1 1 1 1 1 1 31
4 3 4 1 2 5 8 9 169
4
X T Y( 2)
2
3 4 6 7 6 7 5 7 184
5
6
7
248
2.976 1,422
(1) ( 2) 0.460 0.522
0.873 0.524
Y(1) 2.976 0.460 (12) 0.873(10) 11.274
dan
Y( 2 ) 1.422 0.522(12) 0.524(10) 10.082
A2 1
Dimana
adalah nilai Wilk’s lambda
6.337 2.116
E Y Y - ˆ t X t Y
t
1.938 6.448 36.760
0.080
EH Y t Y - ny t y 32 20 460
20 26.875
249
nˆ t
(X t X) 1 X t
Jadi diperoleh:
A2 1 0,080 0.920
hubungan antara variabel respons dan variabel prediktor semakin erat. Jadi fakta ini
hubungan ini hubungan yang sangat erat antara variabel respons dan variabel
prediktor.
H 0 : 11 12 21 22 0
H 1 : paling sedikit ada pq 0
1 4 3 1.480 2.238
1 3 4 1.893 2.240
1 4 6 4.097 3.811
2.976 1,422
1 7
0.522
ˆ 1 3.591 2.768
0.460
1 2 6 3.178 2.766
0.873 0.524
1 5 7 5.429 4.857
1 8 5 5.063 5.375
1 9 7 7.268 6.945
250
1 2 1.480 2.238 0.480 0.238
2 3 1.893 2.240 0.107 0.760
4 2 4.097 3.811 0.097 1.811
2.769 0.591 1.231
ˆ
3 4 3.591
5 2 3.178 2.766 1.822 0.766
4 5 5.429 4.857 1.429 0.143
5 6 5.063 5.375 0.063 0.625
8 7 7.270 6.945 0.732 0.055
6.503 1.956
nˆ t
1.956 6.431
Sehingga:
(T ) 0.813 0.245
ˆ
n 0.245 0.804
4.571 3.339
3.339 3.839
Dan hipotesis nol dari jumlah kuadrat kesalahan dan cross product
matriks:
ˆ)
ˆ
n (1
Dimana:
251
ˆ(1) ( X t1 X1 )1 X1tY
dan
ˆ ( 11 ) ( 11 )
t
1
n
ˆ ) 2.233 1.219
n (ˆ 1 1.219
9.328
Jadi diperoleh
Sehingga didapatkan:
0.3152 0.0937
H 1
0.2739 1.5338
Wilks' lambda =
m
1
1 1 1
( )( ) (0.3839 )(0.8034 ) 0.3085
i 1 i 1 1.6044 1 0.2446
252
dan
ˆt ˆ
ˆ (Y X ) (Y X )
t
n n
Pada kesempatan yang sama dapat diuji bahwa respons
tidak tergantung pada variabel X1 sehingga
H0: β1 = 0
H1: β1 ≠ 0
Under the null hypothesis, the regression model become
Ŷ= X2β ̂2, that is the second column of the design matrix will be
deleted
Pada hipotesis nol, model regresi menjadi Ŷ= X2β 2̂ , dimana kolom kedua dari matriks
desain akan dihapus. Jumlah kuadrat kesalahan dan matriks perkalian silang (cross product
matrix ) E adalah sama yang telah dihitung sebelumnya, tetapi
hipotesis jumlah kuadrat dan matriks perkalian silang akan
menjadi
The error sum of squares and cross product matrix E is the same
one which was computed before, but the hypothesis sum of
squares and cross product matrix will be
ˆ
n( ˆ)
1
Dimana:
1
1 ( 2β̂ 2 ) t ( 2β̂ 2 )
n
dan
253
6.5021 1.9554
1.9554 6.4302
0.0369 0.0411
( ) 1
0.0434 0.0429
0.0798 0.0072
1 0.00243 dan
2
0.0798 0.0072
2 0.0823
2
m
1
1 37 .9858
Wilks' lambda = 0.0571
i 1 i 533 .142
2
i
Pillai's trace = trace [ ( ) 1 ] 0.7455
i 1
1 i
2
Hotelling-Lawley trace = i trace [ 1 ] 0.0429
i 1
Hipotesis:
ˆ
n( ˆ)
1
254
Dimana:
1
1 ( 1β̂1 ) ' ( 1β̂1 )
n
dan
6.5021 1.9554
1.9554 6.4302
0.1285 0.1369
( ) 1
0.1457 0.1525
1
The eigenvalues of the matrix ( ) are:
0.281 0.08036
1 0.0013 dan
2
0.0798 0.0072
2 0.2823
2
m
1
1 37 .9858
Wilks' lambda = 0.0258
i 1 i 1473 .426
2
i
Pillai's trace = trace [ ( ) 1 ] 0.9228
i 1
1 i
2
Hotelling-Lawley trace = i trace [ 1 ] 0.1525
i 1
255
Roy's greatest root = max i 0.0013
X 0 1 2 3 4 5
Y1 1 3 4 8 9 7
Y2 -1 -2 2 4 3 3
256
BAB XI
ANALISIS JALUR
11.1. Pendahuluan
Analisis jalur yang dikenal dengan path analysis dikembangkan
pertama pada tahun 1920-an oleh seorang ahli genetika yaitu Sewall Wright
(Joreskog dan Sorbom, 1996; Johnson dan Wichern, 1992). Teknik analisis
jalur sebenarnya merupakan perkembangan korelasi yang diuraikan menjadi
beberapa interpretasi akibat yang ditimbulkannya. Lebih lanjut, analisis jalur
mempunyai kedekatan dengan regresi berganda. Dengan kata lain, regresi
berganda merupakan bentuk khusus dari analisis jalur. Teknik ini juga
dikenal sebagai model sebab akibat (causing modeling). Penanaman ini
didasarkan pada alas an bahwa analisis jalur memungkinkan pengguna dapat
menguji proposisi teoretis mengenai hubungan sebab akibat tanpa
memanipulasi variabel-variabel (Sarwono, 2007).
Analisa Jalur adalah suatu perluasan dari model regresi, yang
digunakan untuk menguji suatu hubungan kausal yang terdiri dari satu
struktur atau lebih dengan melihat adanya pengaruh langsung dan tak
langsung. Model analisis jalur pada umumnya dilukiskan dalam suatu
gambar lingkaran dan arah panah (circle-and-arrow) dimana panah tunggal
menandai sebagai penyebab.
Dalam aplikasinya, model analisis jalur pada dasarmuaya dapat
dibedakan menjadi dua keperluan. Untuk keperluan prediksi dan pendugaan
nilai variabel endogen nilai-nilai variabel eksogen, maka pola hubungan
yang bersesuaian adalah model regresi, sedang untuk tujuan sebab akibat
pola yang tepat adalah model struktural, jadi secara matematik, analisis ini
mengikuti pola model struktural.
Diketahui bahwa Analisa Jalur merupakan pengembangan dari
analisis regresi berganda sehingga memerlukan asumsi umum dari regresi.
Analisa Jalur sensitive untuk spesifikasi model sebab kegagalan untuk
memasukkan variable yang relevan atau variabel tambahan yang sering
mempengaruhi koefisien jalur, yang digunakan untuk menilai relatif
pentingnya jalur kausal langsung atau pun tidak langsung jalur terhadap
variabel dependent. Sehingga penafsiran harus dikerjakan dalam konteks
model alternatif pembanding, setelah menaksir kecocokan model-model
dibahas pada bagian Model Persamaan Struktural. Ketika variabel di dalam
model adalah variabel tersembunyi yang terukur oleh berbagai indikator
pengamatan, analisis jalur memasukkan model penyamaan struktural, dalam
perlakukan yang terpisah. Kita mengikuti istilah yang konvensional dengan
mana analisis jalur yang mengacu pada variabel indicator tunggal.
Kegunaan:
257
a. Penjelasan terhadap fenomena yang dipelajari atau permasalahan yang
diteliti
b. Prediksi nilai variabel terikat berdasarkan nilai variabel bebas, dan
prediksi dengan path analysis ini bersifat kualitatif.
c. Faktor determinan yaitu penentuan variabel bebas mana yang
berpengaruh dominan terhadap variabel terikat, juga dapat digunakan
untuk menelusuri mekanisme (jalur-jalur) pengaruh variabel bebas
terhadap variabel terikat.
d. Pengujian model, menggunakan teori trimming, baik untuk uji reliabilitas
konsep yang sudah ada ataupun uji pengembangan konsep baru.
Menggunakan analisis jalur ada beberapa prinsip dasar yang harus
diperhatikan:
a. Pola hubungan struktural adalah rekursif, semua anak panah menuju
satu arah, tidak boleh memutar kembali
b. Hubungan antar variabel bersifat linear
c. Data yang digunakan adalah berskala interval
d. Tidak boleh ada milticolineritas
e. Terdapat ukuran sampel yang cukup besar (>100)
Asumsi-asumsi
Analisis Jalur Sebelum melakukan analisis, hendaknya diperhatikan
beberapa asumsi sebagai berikut:
a. Pada model analisis jalur, hubungan antar variabel adalah bersifat linier,
adaptif dan bersifat normal.
b. Hanya system aliran kausal kesatu arah artinya tidak ada arah kausalitas
yang berbalik.
c. Variabel terikat (endogen) minimal dalam skala ukur interval dan rasio.
d. Menggunakan sampel probability sampling yaitu teknik pengambilan
sampel untuk memberikan peluang yang sama pada setiap anggota
populasi untuk dipilih menjadi anggota sampel.
e. Observed variables diukur tanpa kesalahan instrument pengukuran valid
dan reliable artinya variabel yang diteliti dapat diobservasi secara
langsung.
f. Model yang dianalisis dispesifikasikan dengan benar berdasarkan teori-
teori dan konsep-konsep yang relevan artinya model teori yang dikaji
atau diuji dibangun berdasarkan teoretis tertentu yang mampu
menjelaskan hubungan kausalitas antar variabel yang diteliti.
258
campuran dan variable-variabel dependent. Variabel endogenous campuran
mempunyai baik arah panah datang maupun keluar didalam diagram jalur.
Sedangkan variable-variabel dependent hanya mempunyai panah datang.
Ingatlah bahwa untuk regresi bivariat, bobot beta (koefisien β) untuk
data terstandardisasi) adalah sama koefisien korelasi, maka untuk kasus
suatu jalur model dengan suatu variabel sebagai dependent dari variabel
exogenous tunggal (dan bentuk sisa kesalahan), koefisien jalur di dalam
kasus khusus ini adalah suatu koefisien korelasi nol (zero-order).
259
X1 Y1 1
X2 Y2 2
X1 Y1 1
X2 Y2 2
260
Variabel residu disebut juga variabel kesalahan, juga disebut bentuk
gangguan, mencerminkan perbedaan yang tidak dapat diterangkan (efek dari
variabel yang tidak terukur) dan kesalahan pengukuran.
Contoh:
1 variabel residu
Variabel Eksogen
X1
X3 Variabel Endogen
Variabel Endogen
X2
2
Gambar 12.1
(1 R 2 )
Dimana:
adalah residu
R 2 adalah koefisien determinasi
261
1. Direct causal effects (Pengaruh Kausal Langsung) adalah
pengaruh satu variabel eksogen terhadap variabel endogen
yang terjadi tanpa melalui variabel endogen lain.
2. Indirect causal effects (Pengaruh Kausal Tidak Langsung)
adalah pengaruh satu variabel eksogen terhadap variabel
endogen yang terjadi melalui variabel endogen lain terdapat
dalam satu model kausalitas yang sedang dianalisis.
3. Total causal effects (Pengaruh Kausal Total) adalah jumlah
dari pengaruh kausal langsung dan pengaruh kausal tidak
langsung.
Gambar 12.2.a
Gambar 12.2.b
262
Gambar 12.3a.
Gambar 12.3.b
b. Model kompleks
Model ini dikatakan kompleks karena sudah melebihi dua
jalur yang memerlukan analisis yang lebih luas dan mendalam
dibanding analisis satu atau dua jalur sebelumnya.
Gambar 12.4.b
263
Gambar 12.4b.
ε1
X1 ρY1X1
Y1
ρY2Y1
rX1X2 ρY2X1
ρY1X2 Y2
X2 ρY2X2 ε2
Gambar 12.1
264
rY2X2 = ρY2X2 + ρY1X2 ρY2Y1+ rX1X2 ρY2X1+ rX1X2 ρY1X1 ρY2Y1
No. X1 X2 Y1 Y2
1 6 5 6 6
2 7 7 7 4
3 6 6 6 6
4 4 4 4 4
5 3 3 3 3
6 5 5 5 5
7 5 4 4 4
8 4 6 6 6
9 7 2 7 7
10 6 6 6 6
11 2 2 2 2
12 4 4 4 4
ε1
X1 0,81
Y1
1,26
0,48 -0,29
0,20 Y2
-0,25
X2 0,35 ε2
265
Gambar 12.1
Yp a p 0 a p1 X1 a p 2 X1 ..... a pk X k a pkYp 1 e p
Misalkan diambil 2 (dua) variabel eksogen (X1 dan X2) dan dua variabel
endogen (Y1 dan Y20, maka hubungan konseptual digambarkan sebagai berikut:
266
Gambar 12.5
Y1 a1 X 1 a2 X 2 e1 ……………..……..(1)
Y2 b1 X 1 b2 X 2 b 3Y1 e2 ………………..(2)
Y1 a0 a1 X 1 a2 X 2 e1 ……………..……..(3)
Y2 b0 b1 X 1 b2 X 2 b 3Y1 e2 ………………..(4)
Y2 b0 b1 X 1 b2 X 2 b 3 (a0 a1 X 1 a2 X 2 e1 ) e2
atau
267
Persamaan (3) dapat ditulis :
Y2 0 1 X 1 2 X 2 …… (4)
Dimana
0 (b0 a0b3 )
(b3e1 e2 )
Secara rinci pengaruh langsung dan tak langsung serta total dapat dilihat
sebagai berikut:
Pengaruh Total
pengaruh
Langsung Tak langsung
melalui Y1
X1 ke Y1 a1 - a1
X2 ke Y1 a2 - a2
X1 ke Y2 b1 a1b3 b1 +a1b3
X2 ke Y2 b2 a2b3 b2 +a2b3
Y1 ke Y2 b3 - b3
Pengaruh Total
268
Pengaruh Langsung + Pengaruh tak Langsung = Pengaruh Total
Contoh:
1
X1
p X 1X 3
X3
p X 1X 2
pX 2 X 3
X2
1
Latihan:
1. Hitung pengaruh total, residu 1, residu 2, dan residu 3.
2. Tuliskan persamaan-persamaan jalur
2 1
X1
0,32
-0,343 0,37 Y
0,65 X3
0,45 0,71
X2
3
Jika diketahui
R 21 = 0,85
R 2 2 = 0,75
269
R 2 3 = 0,65
Syarat:
1. Hubungan antara variabel merupakan hubungan linear
Semua variabel residu tidak mempunyai korelasi satu sama lain
3. Pola hungnan natar varaibel adalah rekursif
4. Skala penguran baik pada varaibel penyebbab maupun pada varaivbel
akibat sekurang-kurangnya interval.
Jika persyaratan in idipenihi, maka koefsien jalur bisa dihtung
dengan dengan langkah berha sebagazi berikut:
270
1. Hubungan antara variabel merupakan hubungan linear
2. Semua variabel residu tidak mempunyai korelasi satu sama lain
3. Pola hubungan antara variabel adalah rekursif
4. Skala pengujian baik pada variabel penyebab maupun pada variabel
akibat sekurang-kurangnya interval.
Koefisien Regresi
n n
bYXi = Cij X jhYh ; j = 1,2, 3 …k
h 1 h 1
atau
n n n
bYXi =C i1 X jhYh + C i2 X 2 hYh + … + C ik X khYh
h 1 h 1 h 1
sedang
C = (XtX) 1
Sedang
n n n
x X X Y
1
jh y h jhYh 1h h
h 1 j 1 n h 1
n n n
x X X X
1
x ph jh X ph 1h ph
jh n
h 1 i 1 h 1
n n
1 n
h
x 2jh
j 1
X 2jh ( X jh ) 2
n j 1
n n
1 n
y
h
2
jh Y
j 1
2
jh
n j 1
( Y jh ) 2
271
n
x 2
ih
p yxi byxi h 1
n
y
h 1
2
h
Sistem persamaan simultan *** dapat ditulis dalam bentuk matriks, sebagai
berikut.
1
C = RXX R XY
Dimana:
C adalah koefisien jalur
1
RXX adalah invers matriks RX
R XY adalah vektor koefisien korelasi antara variabel bebas X dengan
variabel tak bebas Y.
Menghitung koefisien jalur dengan menggunakan matriks korelasi, pertama
dengan menghitung semua korelasi antar variabel dengan formulasi:
n n n
n X jhYh X jh Yh
rYXj h 1 h 1 h 1
; j 1,2,3...k ; h 1,2,3...n
n n n n
[n ( X ( X j )) [n Y ( Yh ) ]
2
jh
2 2
jh
2
h 1 h 1 h 1 h 1
Buat Matriks
273
CYY CYX1 CYX 2 CYX k
C X1 X 2 C X1 X 2 C X 1 X k
R 1
CX2X2 CX2Xk
C X k X k
3. Koefisien Jalur
Keterangan:
rYXi adalah unsur pada baris ke Y dan kolom ke-Xi dari matriks
korelasi
CYXi adalah elemen pada baris ke Y dan kolom ke-Y dari matriks invers
korelasi.
274
CYX i
pYX i
CYY
1... Xk pY 1
2 2
RYX
atau
pY 1 RYX
2
1... Xk
dimana:
k
2
RYX 1... Xk p i 1
YXi rYXi
Teladan
Y2 Y1 X
1 15 3 16
2 17 11 14
3 19 15 22
4 22 12 23
5 25 7 17
6 29 21 6
7 30 8 31
8 32 9 47
9 35 13 50
10 36 5 29
275
11 38 17 38
12 40 10 19
13 41 15 50
14 43 20 75
15 45 20 77
16 48 22 78
Keterangan :
Y2= Kesehatan
Y1 = Konsumsi
X = Pendapatan
Hipotesis:
1. Semakin tinggi tingkat pendapatan semakin tinggi tingkat konsumsi
2. Semakin tinggi tingkat pendapatan semakin tinggi tingkat
kesehatan
3. Semakin tinggi tingkat konsumsi semakin tinggi kesehatan.
Kerangka Konseptual:
2
pX1Y2 pY2 2
X
pY1X1
Y2
Y1 pY2Y1
pY1 1
1
Keterangan:
X adalah tingkat pendapatan
Y1 adalah tingkat konsumsi
Y2 adalah tingkat kesehatan
276
Correlations
Konsums Pendapata
Kesehatan i n
Pearson Kesehatan 1.000 .559 .784
Correlation Konsumsi .559 1.000 .558
Pendapata .784 .558 1.000
n
Sig. (1-tailed) Kesehatan . .012 .000
Konsumsi .012 . .012
Pendapata .000 .012 .
n
N Kesehatan 16 16 16
Konsumsi 16 16 16
Pendapata 16 16 16
n
Y2 Y1 X
Y1 1,0000 0,558
X 1,00000
atau
1 0,559 0,784
R 1 0,558
1
1 0,559 0,784
R 1 0,558
1
277
Dengan menggunakan Excel diperoleh Invers R dengan simbol R -1
sebagai
Kerangka Konseptual:
2
pX1Y2 pY2 2
X
pY1X1
Y2
Y1 pY2Y1
pY1 1
1
Struktur 1
1
PY1X
PY1 1
Y1
Struktur ini sama dengan struktur regresi linear sederhana atau korelasi
sama dengan koefisien jalur
Sehingga
pY1X = rY1X
278
pY1X = 0,558
pY11 = 1 p X2 2 X 1
pY11 = 1 (0,558) 2
pX21 = 0,830
pY 1 X
t
1 pY21 X
n2
1,7458
279
Struktur 2
Kerangka Konseptual:
2
X
pXY2 pY2 2
Y2
Y1 pY2Y1
pY1 1
1
Y2 Y1 X
Y2 2,7502 0,4824 1,8877
Y1 0,4824 1,5376 0,4801
X 1,8877 0,4801 2,7487
CY 2 X
pY 2 X
CY 2Y 2
(1,8877 )
pY 2 X
2,75017
= 0,686
CY 2Y 1
pY 2Y 1
CY 2Y 2
(0,48243 )
pY 2Y 1 = 0,1754
2,75017
280
Jadi diperoleh koefisien jalur sebagai sebagaimana tertera dalam gambar
berikut:
2
X
0,686 pY2 2
Y2
0,558
Y1 0,175
pY1 1
1
Gambar:
Pengaruh langsung dari X ke Y2 sebesar 0,686
Pengaruh tidak langsung dari X ke Y2 melalui Y1 sebesar 0,558 x 0,175=
0,098
Pengaruh total X ke Y2 melalui Y1 adalah 0,686 + 0,098 = 0,784.
Pengaruh total tersebut tak ada lain adalah nilai korelasi antara X dan Y2
sebesar 0,784 (dekomposisi korelasi).
2
RY22Y 1 X pY 2Y 1rY 2 X
i 1
RY22Y 1 X pY 2 X rY 2 X pY 2Y 1 rY 2Y 1
= 0,6356
H0 : pX3X1 = pX3X2 = 0
281
k
(n k 1) pYXi rYXi
F k
i 1
atau
(16 2 1)(0,636 )
F
2(1 (0,636 )
= 11,3376
F ; k; (n-k-1) = F0,05;2;13
= 3,81
pY 2 X 0,686
t 3,527
1 p 2
Y 2X 1 (0.686 ) 2
n2 16 2
pY 2Y 1 0,1754
t 0,6666
1 p 2
Y 2X 1 (0,1754 ) 2
n2 16 2
282
`BAB XII
ANALISIS FAKTOR
a b c
jelas pada Gambar 12.1 bahwa analisis faktor bertujuan untuk membentuk
suatu kelompok yang memiliki karakter yang relatif sama yang dalam
analisis disebut korelasi. Pada Gambar a tidak akan terbentuk faktor, sedang
pada gambar b terbentuk du faktor dan pada gambar c tiga faktor.
283
Analisis faktor (factor analysis) adalah salah satu keluarga analisis
multivariate yang bertujuan untuk meringkas atau mereduksi variable
amatan secara keseluruhan menjadi beberapa variable atau dimensi baru,
akan tetapi variable atau dimensi baru yang terbentuk tetap mampu
merepresentasikan variable utama. Dalam analisis factor, dikenal dua
pendekatan utama, yaitu exploratory factor analysis dan confirmatory
factor analysis. Digunakan exploratory factor analysis bila banyaknya
factor yang terbentuk tidak ditentukan terlebih dahulu.
Sebaliknya confirmatory factor analysis digunakan apabila faktor yang
terbentuk telah ditetapkan terlebih dahulu.
Analisis faktor eksploratori merupakan suatu teknik untuk mereduksi
data dari variabel asal atau variabel awal menjadi variabel baru atau faktor
yang jumlahnya lebih kecil dari pada variabel awal. Proses analisis faktor
eksploratori mencoba untuk menemukan hubungan antar variabel baru atau
faktor yang terbentuk yang saling independen sesamanya, sehingga bisa
dibuat satu atau beberapa kumpulan variabel laten atau faktor yang lebih
sedikit dari jumlah variabel awal yang bebas atau tidak berkorelasi
sesamanya. Jadi antar faktor yang terbentuk tidak berkorelasi sesamanya.
Sedang analisis faktor konfirmatori yaitu suatu teknik analisis faktor di
mana secara apriori berdasarkan teori dan konsep yang sudah diketahui
dipahami atau ditentukan sebelumnya, maka dibuat sejumlah faktor yang
akan dibentuk, serta variabel apa saja yang termasuk ke dalam masing-
masing faktor yang dibentuk dan sudah pasti tujuannya. Pembentukan faktor
konfirmatori (CFA) secara sengaja berdasarkan teori dan konsep, dalam
upaya untuk mendapatkan variabel baru atau faktor yang mewakili beberapa
item atau sub-variabel, yang merupakan variabel teramati atau observed
variable.
Supranto, 2010 menyatakan bahwa analisis faktor digunakan untuk
mereduksi data/variabel. Analisis faktor dipergunakan dalam kondisi
sebagai berikut :
1. Mengenali atau mengidentifikasi dimensi yang mendasari (underlying
dimensions) atau faktor, yang menjelaskan korelasi antara suatu set
variabel.
2. Mengenali atau mengidentifikasi suatu set variabel baru yang tidak
berkorelasi (independent) yang lebih sedikit jumlahnya untuk
3. menggantikan suatu set variabel asli yang saling berkorelasi di dalam
analisis multivariat selanjutnya.
4. Mengenali atau mengidentifikasi suatu set variabel yang penting dari
suatu set variabel yang lebih banyak jumlahnya untuk dipergunakan
dalam analisis multivariat selanjutnya.
Asumsi mendasar yang harus digarisbawahi dalam analisis faktor
adalah bahwa variable-variabel yang dianalisis memiliki keterkaitan atau
saling berhubungan karena analisis factor berusaha untuk mencari common
dimension (kesamaan dimensi) yang mendasari variable-variabel itu.
Sedang tujuan utama analisis faktor adalah untuk menjelaskan struktur
hubungan di antara banyak variabel dalam bentuk faktor atau variabel laten
284
atau variabel bentukan. Faktor yang terbentuk merupakan besaran acak
(random quantities) yang sebelumnya tidak dapat diamati atau diukur atau
ditentukan secara langsung. Selain tujuan utama analisis faktor, terdapat
tujuan lainnya adalah:
1. Untuk mereduksi sejumlah variabel asal yang jumlahnya banyak
menjadi sejumlah variabel baru yang jumlahnya lebih sedikit dari
variabel asal, dan variabel baru tersebut dinamakan faktor atau
variabel laten atau konstruk atau variabel bentukan.
2. Untuk mengidentifikasi adanya hubungan antar variabel penyusun
faktor atau dimensi dengan faktor yang terbentuk, dengan
menggunakan pengujian koefisien korelasi antar faktor dengan
komponen pembentuknya. Analisis faktor ini disebut analisis
faktor konfirmatori.
3. Untuk menguji validitas dan reliabilitas instrumen dengan analisis
faktor konfirmatori.
Menggunakan analisis faktor, secara garis besar tahapan yang dapat ditempuh
adalah alangkah-langkah berikut:
1. Merumuskan masalah
2. Mengumpulkan data
3. Menyusun matriks korelasi atau varian-kovarians
4. Ekstraksi faktor untuk menentukan dan menunjukkan jumlah faktor yang dapat
dibuat
5. Memilih metode estimasi
6. Merotasi faktor
7. Interpretasi faktor.
8. Pembuatan factor scores dan penggunaan analisis lebih lanjut.
285
yang nilainya tidak terobservasi, 𝜀1, 𝜀2,… , 𝜀𝑝 merupakan kesalahan
(error) atau faktor spesifik. Secara matematis model analisis faktor
ditulis sebagai berikut (Johnson, 2007:482):
Atau
X 1 1 a11 a12 a1m F1 1
X a a22 a2 m F
2 2
21
2 2
X P p a p1 a pm Fm p
Dimana:
286
Asumsi:
E ( F ) 0, Cov( F ) I E ( ) 0 dan
1 0 0
0 0
Cov( ) , Cov( F , ) 0 dimana F dan saling
1
0 0 p
bebas.
dan
Cov ( X , F ) E ( X ) F A
Berdasarkan persamaan (11.3)
287
Rotasi Loading Faktor
Anggaplah suatu matriks suatu matriks T yang berukuran k x k
sehingga berlaku TT t T tT I Persamaan ini dapat ditulis kembali:
X AF ATT t F ….. (11.16)
Jika
L* AT dan L* T t F
X AF ATT t F
AF L * F *
m
i ii aij2
j 1
Atau
i diag ( AAt )
288
Estimasi Komponen Dasar
Menggunakan metode komponen dasar dalam estimasi (atau R jika
data observasi baku) dan menggunakan X untuk mengestimasi . Maka
estimasi komponen dasar dari matriks loading untuk m model faktor adalah
A ˆ1 eˆ1 ˆ2 eˆ2 .... ˆm eˆm dimana ̂i dan êi
~
adalah eigenvalue dan
eigenvector dari S atau (R jika data baku)
~1 0 0
0 ~ 0 m
, ~i sii a~ij2
~ 2
j 1
~
0 0 p
Sedang kommunaliti diestimasi dengan
~
hi 2 a~i21 a~i22 ... a~im2
kontribusi faktor ke-k terhadap varians sampel total s11 s22 s33 ...s pp
diestimasi dengan
a~12k a~22k a~32k ... a~pk
2
( ˆk eˆk )t ( ˆk eˆk ) ˆk
289
Dalam analisis faktor, sebagaimana yang telah disebutkan diperlukan
beberapa tahap, diantaranya yaitu:
a. Setelah tabulasi data, dilakukan penentuan besaran nilai Barlett test of
sphericity, yaitu suatu uji statistik yang dipergunakan untuk menguji
hipotesis bahwa variabel tidak saling berkorelasi (uncorrelated) dalam
populasi.
(2 p 5)
2 (n 1) ln R
6
Dengan derajat kebebasan
p( p 1)
df
2
keterangan:
n = jumlah sampel
p = jumlah variabel
R = determinan matriks korelasi
b. Penentuan Keiser-Meyesr-Okliti (KMO), merupakan suatu uji untuk
menunjukkan apakah metode sampling (mengukur kecukupan sampel)
yang digunakan sudah memenuhi syarat atau tidak.
p p
r
i 1 j i
2
ij
KMO p p p p
r a
i 1 j i
2
ij
i 1 j i
2
ij
keterangan:
rij = Koefisien korelasi sederhana antara ke-i dan ke-j.
aij = Koefisien korelasi parsial antara variabel ke-i dan ke-j. i = 1,2,3,...,p
dan j = 1,2,3,...,p
Kriteria kesesuaian dalam pemakaian analisis faktor adalah (Keiser, 1974):
1. Jika harga KMO sebesar 0,9 berarti sangat memuaskan
2. Jika harga KMO sebesar 0,8 berarti memuaskan
3. Jika harga KMO sebesar 0,7 berarti harga menengah
4. Jika harga KMO sebesar 0,6 berarti cukup
5. Jika harga KMO sebesar 0,5 berarti kurang memuaskan
290
6. Jika harga KMO kurang dari 0,5 tidak dapat diterima
p p
r
i 1 j i
2
ij
MSA p p
rij2 aij2
i 1 i 1
keterangan:
rij2 = Kuadrat matriks korelasi sederhana
aij2 = Kuadrat matriks korelasi parsial
p = jumlah variabel
d. Ekstraksi Faktor
Pada tahap ini, akan dilakukan proses inti dari analisis faktor, yaitu
melakukan ekstrasi terhadap sekumpulan variabel yang ada KMO > 0,5
sehingga terbentuk satu atau lebih faktor. Metode yang digunakan untuk
maksud ini adalah principal component analysis dan rotasi faktor dengan
metode varimax. Setelah sejumlah variabel terpilih, maka dilakukan ekstrasi
variabel tersebut sehingga menjadi beberapa faktor. Setelah memproses
variabel-variabel yang layak, maka dengan program SPSS 22 akan diperoleh
nilai hasil statistik yang menjadi indikator utama yaitu tabel communalities,
tabel total variance explained, grafik scree, tabel component matrix dan
tabel rotated component matrix.
Tabel communalities merupakan tabel yang menunjukkan persentase
variansi dari tiap variabel yang dapat dijelaskan oleh faktor yang terbentuk.
Nilai yang dilihat adalah extraction yang terdapat pada tabel communalities.
Makin kecil nilainya, makin lemah hubungan antara variabel yang
terbentuk. Communality adalah jumlah varian yang disumbangkan oleh
suatu variabel dengan seluruh variabel lainnya dalam analisis. Bisa juga
disebut proporsi atau bagian varian yang dijelaskan oleh common factor
atau besarnya sumbangan suatu faktor terhadap varian seluruh variabel.
291
Tabel total variance explained, menunjukkan persentase varians
yang dapat dijelaskan oleh faktor secara keseluruhan. Nilai yang menjadi
indikatornya eigenvalues yang telah mengalami proses ekstrasi. Pada tabel
akan tercantum nilai
extraction sum of square loading. Hal ini disebabkan nilai eigenvalues tidak
lain merupakan jumlah kuadrat dari faktor loading dari setiap variabel yang
termasuk ke dalam faktor. Factor loading ini merupakan nilai yang
menghubungkan faktor-faktor dengan variabel-variabel. Variabel yang
masuk ke dalam faktor adalah yang nilainya lebih dari satu. Dari sini akan
terlihat pula jumlah faktor yang akan terbentuk.
Scree plot menggambarkan tampilan grafik dari tabel total variance
explained. Grafik ini sebenarnya menunjukkan peralihan dari satu faktor ke
faktor lainnya garis menurun di sepanjang sumbu y. Sumbu x menunjukkan
jumlah komponen faktor yang terbentuk, sedangkan sumbu y menunjukkan
nilai eigenvalues.
Tabel component matrix menunjukkan kategori variabel-variabel ke
dalam komponen faktor, atau dengan kata lain menunjukkan distribusi
variabel-variabel pada faktor yang terbentuk. Bila yang dijadikan acuan
adalah nilai factor loading yang ada dalam tabel, dimana nilai lebih besar
menunjukkan korelasi yang cukup kuat antara variabel-variabel tersebut
dengan komponen faktor. Jumlah jasa kuadrat factor loading dari tiap
variabel tidak lain merupakan nilai extraction
untuk tiap variabel yang tercantum dalam tabel communalities.
e. Rotasi Faktor
Pada rotasi faktor, matriks faktor ditransformasikan ke dalam matrik
yang lebih
sederhana, sehingga lebih mudah diinterpretasikan. Dalam analisis ini rotasi
faktor dilakukan dengan metode rotasi varimax. Hasil dari rotasi ini terlihat
pada tabel rotated component matrix, di mana dengan metode ini nilai total
variansi dari tiap variabel yang ada di tabel component matrix tidak
berubah. Yang berubah hanyalah komposisi dari nilai factor loading dari
tiap variabel. Interpretasi hasil dilakukan dengan melihat factor loading.
Factor loading adalah angka yang menunjukkan besarnya korelasi
antara suatu variabel dengan faktor satu, faktor dua, faktor tiga, faktor empat
atau faktor lima yang terbentuk. Proses penentuan variabel mana akan
masuk ke faktor yang mana, dilakukan dengan melakukan perbandingan
292
besar korelasi pada setiap baris di dalam setiap tabel. Dalam hal ini
digunakan metode varimax, karena bertujuan untuk mengekstraksi sejumlah
variabel menjadi beberapa faktor. Selain itu metode ini menghasilkan
struktur relatif lebih sederhana dan mudah diinterpretasikan.
f. Penamaan Faktor
Pada tahap ini akan diberikan nama-nama faktor yang telah terbentuk
berdasarkan factor loading suatu variabel terhadap faktor terbentuknya,
setelah tahapan pemberian nama faktor terbentuk
293
X4 = Jumlah dalam keluarga
X5 = Jumlah anak
X6 = Pendidikan kepala keluarga
X7 = Pendidikan istri
X8 = umur kepala keluarga
No. X1 X2 X3 X4 X5 X6 X7 X8
1 6 5 6 6 3 11 6 37
2 7 7 7 4 2 13 9 54
3 6 6 6 6 4 12 9 67
4 4 4 4 4 4 10 8 38
5 3 3 3 3 3 9 6 27
6 5 5 5 5 5 11 8 38
7 5 4 4 4 2 8 5 31
8 4 6 6 6 3 9 6 52
9 7 2 7 7 4 14 11 50
10 6 6 6 6 3 12 9 49
11 2 2 2 2 2 11 8 47
12 4 4 4 4 2 12 9 39
13 6 6 6 5 3 13 10 45
14 8 9 9 9 2 9 6 39
15 7 7 7 5 3 12 7 48
16 4 3 7 3 3 9 6 41
17 3 4 4 3 2 8 5 37
18 8 4 9 9 3 9 7 39
294
1.1.Kaiser-Meyer-Olkin and Bartlett's Test.
Tes Kaiser-Meyer-Olkin and Bartlett digunakan untuk menyatakan
kelayakan variabel yang ada dapat difaktorkan. Nilai KMO-MSA
dan nilai peluang (sig. = p.) dapat dilihat pada Tabel 11.2. Dari hasil
analisis kelayakan faktor diketahui bahwa nilai KMO-MSA (Kaiser-
Meyer-Olkin Measure of sampling adequacy ) sebesar 0,646 dengan
nilai peluang (p) < 0,05 ini berarti bahwa semua sub-variabel
pengukuran atau dimensi menabung masyarakat (dari X1sd X8)
memenuhi syarat untuk difaktorkan, Tabel 11.2.
df 28
Sig. .000
Anti-image Matrices
X1 X2 X3 X4 X5 X6 X7 X8
Anti-image Covariance X1 .095 -.062 -.082 -.073 .028 -.049 .015 .081
X2 -.062 .486 .027 -.017 .091 -.029 .080 -.173
X3 -.082 .027 .157 -.022 -.006 .026 .009 -.105
X4 -.073 -.017 -.022 .202 -.094 .071 -.057 -.022
X5 .028 .091 -.006 -.094 .783 -.010 -.034 -.015
295
X6 -.049 -.029 .026 .071 -.010 .106 -.096 -.054
X7 .015 .080 .009 -.057 -.034 -.096 .126 -.034
X8 .081 -.173 -.105 -.022 -.015 -.054 -.034 .466
Anti-image Correlation X1 .631a -.288 -.670 -.528 .104 -.485 .137 .384
X2 -.288 .727a .099 -.053 .148 -.130 .324 -.363
X3 -.670 .099 .734a -.121 -.018 .202 .062 -.388
X4 -.528 -.053 -.121 .698a -.236 .489 -.355 -.072
X5 .104 .148 -.018 -.236 .763a -.035 -.109 -.025
X6 -.485 -.130 .202 .489 -.035 .523a -.830 -.242
X7 .137 .324 .062 -.355 -.109 -.830 .583a -.138
X8 .384 -.363 -.388 -.072 -.025 -.242 -.138 .660a
296
1.4. Communalities atau peranan faktor
Initial Extraction
X1 1.000 .899
X2 1.000 .550
X3 1.000 .872
X4 1.000 .791
X5 1.000 .248
X6 1.000 .867
X7 1.000 .897
X8 1.000 .562
297
pembentukan faktor bersama adalah 89,9 % artinya X1 dapat
menjelaskan faktor sebesar 89,9%.
Component
1 2
PendapataKK .899 -.303
PendapatanAnak .820 -.446
JumlahKeluarga .783 -.422
Umur .606 .441
PendapatanIstri .604 -.430
PendidikanIstri .537 .780
PendidikanKK .583 .726
JumlahAnak .299 .399
298
Tabel 11.6. Rotated Component
Matrixa
Component
1 2
X3 .929 .090
X1 .914 .252
X4 .885 .090
X2 .741 -.017
X7 .007 .947
X6 .076 .928
X8 .255 .705
X5 .024 .498
Ternyata dari Tabel 11.6 setelah dirotasi maka terilihat dengan jelas
variabel yang masuk dalam suatu faktor dengan varaibel yang sudah
terutut. Setelah itersasi ke-3 kalinya menjadi konvergen, sehingga
variabel pembentuk faktor dapat terlihat dengan jelas ada gamba 11.1.
Dari tabel 11.6 dapat disumpulkan bahwa
Variabel yang masuk kepada Faktor 1 adalah X3,X1, X4 dan X2
Variabel yang masuk kepada Faktor 2 adalah X7,X6, X8 dan X5
299
Gambar 11.1. Variabel Pembentuk faktor setelah Rotasi.
Faktor rotation, apabila antara komponen faktor yang satu dan
komponen faktor yang lain terdapat nilai-nilai komponen faktor dalam satu
variabel pengukuran yang ≥ 0,5 pada kedua faktor bersama, maka analisis
faktor harus diulang dengan cara lain atau dilakukan rotasi faktor (factor
rotation). Dalam analisis ini terlihat bahwa tidak terdapat satu variabel
yang memiliki
300
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Component Scores.
Component
1 2
X1 .289 .025
X2 .254 -.070
X3 .308 -.043
X4 .293 -.039
X5 -.034 .201
X6 -.054 .373
X7 -.079 .386
X8 .026 .266
Perlu dipahami bahwa pada analisis faktor semua dimensi atau sub-variabel
penyusun faktor atau item telah ditransformasikan ke dalam data standar
atau data Z (data Z mempunyai rata-rata = 0, varians = 1, dan data tanpa
satuan atau relatif)
Nilai koefisien skor matrix atau bobot faktor diambil dari Tabel 13.6 ,
sehingga persamaan skor faktor dari contoh analisis menjadi
Skor faktor 1
~ ~ ~ ~ ~ ~ ~ ~
F1 0,289 X 1 0,254 X 2 0,308 X 3 0,293 X 4 0,034 X 5 0,054 X 6 0,079 X 7 0,026 X 8
301
Skor faktor 2
~ ~ ~ ~ ~ ~ ~ ~
F2 0,025 X 1 0,070 X 2 0,043 X 3 0,039 X 4 0,201 X 5 0,373 X 6 0,386 X 7 0,266 X 8
302
BAB XIII
MODEL PERSAMAAN SIMULTAN
303
disebut seemingly unrelated regression (SUR) yang tidak akan diuraikan
dalam pembahasan ini.
Sebagai perbandingan antara persamaan tunggal dan persamaan
simultan perhatikan gambar berikut:
Yt Xt Yt Xt
t It vt t
304
dependen saling pengaruh mempengaruhi. Dalam kontenks sistem
banyak persamaan (multi-equation system), sistem persamaan simultan
dinyatakan:
i y xi i i 1,2,3.......n
lxg gxg lxk kxg lxg (13.1)
Dimana
1
kxg kxg gxg
i i 1
lxg lxg gxg
(13.4)
nxg gxg nxk kxg nxg
Dimana :
dan
305
Persamaan (13.4) jika direduksi menjadi model persamaan
tunggal, yakni jika g=1 sehingga menjadi vektor kolom y dan
matriks menjadi elemen tunggal yang dapat dipilih -1 untuk
menormalisasi persamaan. Selanjutnya lebur menjadi vektor kolom
dan menjadi -u. Sehingga persamaan (13.4) menjadi
y(1) u
atau
y u
Y1t 12Y2t 13Y3t 14Y4t ... 1mYmt ... 11 X 1t 12 X 2t ... 1k X kt t1
Y2t 22Y1t 23Y3t 24Y4t ... 2 mYmt ... 21 X 1t 22 X 2t ... 2 k X kt 2t
Y3t 32Y1t 32Y2t 34Y4t ... 3mYmt ... 31 X 1t 32 X 2t ... 3k X kt 3t
Ymt m 2Y1t m 2Y2t m 4Y4t ... mmYmt ... m1 X 1t ,m 2 X 2t ... mk X kt mt
Dimana:
Y1t , Y2t , Y3t , ..., Ymt m variabel endogen yang bersifat random
X 1t , X 2t , X 3t , ..., X kt k variabel eksogen yang bersifat nonrandom
1 , 2 , 3 , ..., m m kesalahan (error) yang bersifat random dengan
E( mt ) 0, i = 1,2,3, …, m
t=1, 2, 3, … n = n observasi
306
fungsi permintaan Qtd 0 1 Pt 1t α1< 0
fungsi penawaran Q 0 1Pt 2t
t
s
β1> 0
kondisi keseimbangan Q Q t
d
t
s
d
dimana: Q = kuantitas yang diminta
Qs = kuantitas yang ditawarkan
t = waktu
Ada hubungan dua arah atau simultan antara X dan (beberapa dari)
X, yang membuat perbedaan antara variabel tak bebas dan variabel yang
menjelaskan menjadi meragukan. Adalah lebih baik untuk mengumpulkan
bersama sama sejumlah variabel yang dapat ditentukan secara simultan oleh
kumpulan variabel sisanya. Inilah yang dilakukan dalam persamaan
simultan. Dalam model seperti itu ada lebih dari satu persamaan, satu untuk
variabel tidak bebas atau bersifat endogen atau gabungan atau bersama.
Dan tidak seperti persamaan model tunggal, dalam model persamaan
simultan orang mungkin tidak menaksir parameter dari satu persamaan
tunggal tanpa memperhitungkan informasi yang diberikan oleh persamaan
lain dalam sistem.
Apa yang terjadi jika parameter dari tiap persamaan ditaksir dengan
menerapkan, misalnya metode OLS, tanpa memperhatikan persamaan lain
dalam sistem? Ingat bahwa satu asumsi penting dari metode OLS adalah
bahwa variabel X yang menjelaskan baik bersifat nonstokastik atau jika
stokastik (random) didistribusikan secara bebas (independen) dari unsur
gangguan stokastik. Jika tak satupun dari kondisi ini dipenuhi, maka,
penaksir kuadarat terkecil tidak hanya bias tapi juga tak konsisten, yaitu
dengan meningkatnya sampel secara tak terbatas, penaksir tidak mengarah
ke nilai (populasi) sebenarnya.
307
Sebagi contoh, model permintaan dan penawaran.seperti dikenal
dengan baik, harga P dari komoditas dan kuantitas Q yang terjual ditentukan
oleh perpotongan kurva pendapatan dan penawaran untuk komoditi itu. Jadi
dengan mengasumsikan untuk penyederhanaan bahwa kurva penawaran dan
kurva permintaan adalah linear dan dengan menambahkan unsur gangguan
stokastik µ1 dan µ2, fungsi empiris permintaan dan penawaran bisa ditulis
sebagai berikut :
Fungsi permintaan Qtd 0 1 Pt 1t α1< 0
(13.5)
Fungsi penawaran Qts 0 1Pt 2t β2> 0
(13.6)
Kondisi keseimbangan Qtd Qts
d
dimana Q = kuantitas yang diminta
Qs = kuantitas yang ditawarkan
t = waktu
α dan β adalah parameter. Secara apriori α diharapkan untuk negatif (kurva
permintaan yang miring ke bawah) dan β1 diharapkan positif (kurva
penawaran yang mengarah ke atas).
Sekarang tidak terlalu sulit untuk melihat bahwa P dan Q adalah
variabel tak bebas bergabung. Jika misalnya µi dalam (1.3) berubah karena
perubahan dalam variabel lain yang mempengaruhi Qdt (seperti pendapatan,
kekayaan dan selera), kurva permintaan akan bergeser ke atas.
308
akan melanggar asumsi penting dari model regresi linear klasik, yaitu
asumsi tidak adanya korelasi antara variabel yang menjelaskan dan unsur
gangguan.
309
Reduced form adalah persamaan yang diperoleh dengan
memecahkan sistem persamaan struktural sedemikian rupa sehingga bisa
dinyatakan setiap variabel endogen dalam model hanya sebagai fungsi
variabel eksogen atau predetermined variable
Contoh:
Ct 0 1Yt t
Yt Ct I t
Ct 0 1 (Ct I t ) t
Ct 0 1Ct 1I t t
Ct (1 1 ) 0 1I t t
0 1 1
Ct It t
(1 1 ) (1 1 ) (1 1 )
Ct 0 1I t vt
0 1 1
0 ; 1 ; vt t
(1 1 ) (1 1 ) (1 1 )
Jadi
Yt Ct I t
Yt 0 1I t I t vt
Yt 0 (1 1 ) I t vt
atau
Yt 0 1I t vt
Dimana:
0 0
1 (1 1 )
1. Order Conditions
Kondisi order (order condition) merupakan syarat wajib (necessary
condition) sebagai suatu sistem persamaan simultan, agar suatu
persamaan teridentifikasi. Dalam hal in terdapat dua jenis, yaitu; setem
persamaan yang tidak memiliki predetermined variable (variabel yang
sudah ditentukan) dan sistem persamaan yang memiliki predetermined
variable.
Perhatikan kembali sistem persamaan (13.5 da 13.6) yang dapat
ditulis sebagi berikut:
311
Qt 0 1Pt 1t ...............(13.5)
Qt 0 1Pt 2t ...............(13.6)
312
M=2 =G-1= 2 , sehingga persamaaan permintaan tersebut
teridentifikasi
Catatan:
Persamaan yang dapat diselesaikan dengan sistem persamaan
simultan adalah persamaan yang identified dan over identified.
313
Y1t 10 12Y2t 13Y3t 11 X 1t 0 X 2t 0 X 3t 1t
(8a)
1 Y1 Y2 Y3 Y4 X1 X2 X3
314
Tak tercakup (K-k) satu (m-1)
8a 2 2 Exactly
8b 1 1 Exactly
8c 1 1 Exactly
8d 2 2 Exactly
0 22 0 0 22 0
A 0 32
0 atau det A = 0 32 0 =0
1 0 43 1 0 43
Jelas diperoleh:
Det (A) = 0
Terlihat bahwa det (A) = 0, rank (A) < 3, sehingga persamaan 8a
tidak memenuhi rank condition, maka oleh karena not identified
(koefisien yang tak dapat diperkirakan). Jadi walaupun syarat order (orde
condition) merupakan syarat yang perlu dan cukup ( a necessary and
sufficient condition) untuk identifikasi. Maka dari itu, walaupun syarat
order ( order condition) menunjukkan identified namun kondisi rank
menunjukkan tidak identified. Jadi kolom-kolom atau baris –baris dari
matris A tidak bebas secara linear (not linearly independent), artinya
terdapat hubungan antara variabel Y4, X2 dan X3.
Sebagai konsekuensinya, tidak terdapat informasi yang cukup
untuk meperkirakan parameter-parameter dari persamaan 8a. Pembaca
315
diminta untuk menunjukkan bahwa dengan syarat rank, persamaan 8b
dan persamaan 8c adalah tak dapat diperkirakan ( unidentifired) akan
tetapi persamaan 8d dapat diperkirakan (unidentifired).
Identifikasi 1.10.
persamaan Koefisien
1 Y1 Y2 Y3 Y4 X1 X2 X3
1 0 0 1 0 0
A 31 0
0 atau det A = 31 0 0 =0
41 1 43 41 1 43
316
13.5.1.Indirect Least Squares (ILS)
Contoh:
Qtd Qts
(0 0 ) 2 ( 1t )
Pt Yt 2t
(1 1 ) (1 1 ) (1 1 )
317
atau
( 0 0 ) 2 ( 2t )
Pt Yt 1t
( 1 1 ) ( 1 1 ) ( 1 1 )
Pt 1 2Yt v1t
Dimana:
( 0 0 ) 2 1t 2t
1 ; 2 ; v1t
( 1 1 ) ( 1 1 ) ( 1 1 )
Qt 3 4Yt 1v2t
318
Qt (0 11 ) 1 2Yt (1v1t 1t )
Qt 3 4Yt 1v2t
dan
4
1 2 4 , sehingga 1
2
93 99 1883
92 100 1909
92 103 1969
96 106 2015
93 106 2126
99 103 2239
95 105 2335
104 97 2534
Sumber: Supranto,1995
319
Diketahui dari masalah identifikasi bahwa hanya fungsi
supply yang identified sedangkan fungsi demand tidak
teridentifikasi, sehingga yang mau ditentukan adalah fungsi supply
dengan menggunakan nilai parameter-parameter yang diperoleh
dari proses reduce form.
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
a. Dependent Variable: Pt
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
320
Qˆ 47.220 0,023Yt
t : 7,906 9,174
Sig : 0,000 0,000
R 2 0,866
0,0228
1 0,4318
0,052
Qˆ 51,2911 0,4318 P
321
Y2t 20 21Y1t 2t ……………. (9.2)
Dimana:
Y1 = pendapatan
Y2 = stok uang
X 1 = pengeluaran investasi
Variabel
322
Tahap Pertama ( Stage I)
Membuat agar Y1 tidak berfkorelasi dengasn 2 , regresikan terdahulu
Y1 dengan pretermined varaibel yang berada dalam suatu sistem
persmaan (model), tidak hanya yang terdapat pada persamaannya sendiri.
Jadi dalam hal ini regression Y1 terhadap X 1 dan X 2 sebagai
berikut
Y2t 20 21 (Yˆ1t ˆ t ) 2t
20 21Yˆ1t ( ˆ t 21 2t )
323
pada persamaan (9.6) tidak berkorelasi dengan *t secara asimtotis.,
yaitu untuk sampai yang besar kalau menuju tak hingga. Sebagai
konsekuensinya metode OLS dapat dipergunakan dan akan menghasilkan
satu perkiraan parameter untuk fungsi money supply yang tetap asas
(consistent estimate).
Ide dasar prosedur dua fase (two-stage) adalah membebaskan
variabel Y1 dari kesalahan penggangu 2 . Hal ini dilakukan dengan
meregres dalam bentuk sederhana dari Y1 terhadap semua predetermined
variable dalam sistem tahap I. Sebagai suatu ilustrasi lanjutan tentang 2
SLS rubahlah menjadi:
Dimana
Y2t 20 21 X 1t 22 X 2t 23 X 3t 24 X 4t ̂ 2t …. (9.10)
324
Tahap II
Selanjutnya Yˆ1t dan Yˆ2t dari persamaan asli diganti dengan Y1t dan Y2t
sebagai berikut:
Dimana :
325
------------------------------------------------------------------------------------------
Sumber: Gujarati, 1985
Tahap I
TSLS untuk menduga GDP. Regresikan GDP terhadap investasi
swasta dan investasi pemerintah diperoleh:
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
a. Dependent Variable: Y1
Y2t 127,976 0,5170 X 1t 3,813 X 2t
R 2 0,995
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 51.518 27.684 1.861 .078
Tahap II
326
t : (1,861) (17,944)
sig : (0,078) (0,000)
R 2 0,942
M t 0 1Pt 2 N 1t
Pt 0 1M t 2 R 2t
M t 0 1 ( 0 1M t 2 R 2t ) 2 N 1t
M t 11M t 0 1 0 1 2 R 1 2t 2 N 1t
1 0 1 2 Rt N 1 2 t
Mt 0 2 t 1t
1 11 1 11 1 11 1 11
M t 0 1 Rt 2 N 3t
Pt 0 1 ( 0 1 Pt 2 N 1t ) 2 R 2t
Pt 11 Pt 0 1 0 2 1 N 11t 2 R 2t
0 1 2 1 N t 2 Rt 11t
Pt 0 2t
1 11 1 11 1 11 1 11
Pt 3 4 Rt 5 N 3t
327
Contoh:
Tahun PDB Supply Bill Rate CPI M hat Phat
Uang (%)
(Yt) (Mt) Rt Pt
1970 1010.7 628.1 6.46 38.8 643.503 -1.729
1971 1097.2 717.2 4.35 40.5 695.707 -8.265
1972 1207 805.2 4.07 41.8 762.256 -11.65
1973 1349.6 861 7.04 44.4 848.384 -8.427
1974 1458.6 908.6 7.89 49.3 913.257 -8.549
1975 1585.6 1023.3 5.84 53.8 989.242 -15.83
1976 1768.4 1163.7 4.99 56.9 1099.73 -21.91
1977 1974.1 1286.6 5.27 60.6 1223.98 -25.49
1978 2232.7 1388.7 7.22 65.2 1380.21 -25.53
1979 2488.6 1496.7 10.04 72.6 1533.87 -24.29
1980 2708 1629.5 11.51 82.4 1664.47 -26.17
1981 3030.6 1792.9 14.03 90.9 1858.45 -27.27
1982 3149.6 1951.9 10.69 96.5 1929.19 -38.21
1983 3405 2186.1 8.63 99.6 2083.96 -49.45
1984 3777.2 2374.3 9.58 103.9 2309.59 -54.04
1985 4038.7 2569.4 7.48 107.6 2467.88 -64.05
1986 4268.6 2811.1 5.98 109.6 2607.46 -74.59
1987 4539.9 2910.8 5.82 113.6 2771.63 -78.15
1988 4900 3071.1 6.69 118.3 2989.74 -81.96
1989 5250.8 3227.3 8.12 124 3201.85 -84.67
1990 5522.2 3339 7.51 130.7 3365.19 -89.4
1991 5677.5 3439.8 5.42 136.2 3458.11 -96.29
Sumber: Gujarati, 2004.
Tahap I
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 126.102 43.065 2.928 .009
R2 =0,99
328
M t 126.10 12,932 Rt 0,616Yt
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
a. Dependent Variable: P
R2 = 0,99
Pt 12,184 1,275 Rt 0,020Yt
Tahap II
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
329
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
a. Dependent Variable: M
R2 =0,99
M t 39,78 0,33Pt 0,61Yt
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 7.990 2.225 3.592 .002
M .033 .001 .972 49.994 .000
R 1.704 .253 .131 6.736 .000
a. Dependent Variable: P
R2 =0,99
Stage III
330
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 194.388 36.763 5.288 .000
Y .444 .034 .722 13.083 .000
Phat -8.550 1.685 -.280 -5.073 .000
a. Dependent Variable: M
R2 =0,99
M t 194,39 8,550 Pt 0,444Yt
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 10.977 2.685 4.088 .001
Mhat .034 .001 .975 40.856 .000
R 1.289 .310 .099 4.154 .001
a. Dependent Variable: P
R2 = 0,98
Pt 10,977 0,034 M t 1,289 Rt
Soal:
1. Apa yang dimaksud dengan persmaan simultan
2. Jelaskan perbedaan variabel endogen dan variabel eksogen.
Berikan contoh sehingga jelas jawaban Anda.
3. Apa yang dimaksud dan jelaskan disertai dengan contoh
a. Persamaan struktural
b. Persamaan Simultan yang bias
c. Bentuk persamaan yang sederhana.
4. Suatu model ekonomi dari suatu negara sebagai beikut:
Yt 0 1Yt 1 2 I t 1t
I t 3 4Yt 1 5Qt 2t
331
Ct 6 7Yt 8Ct 9 Pt 3t
Qt 10 11Qt 1 12 Rt 4t
Dimana:
Y = pendapatan nasional
I = pembentukan modal neto (net capital formation)
C = Konsumsi rumah tangga
Q = laba
R= produktivitas sektor industry
T= tahun
P = index biaya hidup
= kesalahan pengganggu.
a. Menurut pendapat Anda variabel mana yang termasuk
eksogen yang d nilainya harus ditentukan dari luar model.
b. Adakah persamaan di dalam model yang dapat diperkirakan
dengan metode kuadrat terkecil yang biasa (ordinary Least
square), jika ada berikan alasan Anda
c. Mengapa atau berikan alasan variabel P masuk ke dalam
persamaan konsumsi.
5. Suatu studi tentang pengaruh iklan terhadap hasil penjualan rokok,
dengan menggunakan suatu model sebagai berikut:
Dimana:
332
X1 = Pendapatan disposable dibagi penduduk di atas 20 tahun dibagi
dengan indeks harga konsumen
= kesalahan pengganggu
333
REFERENSI
Dougherty 2001, 2002 (These tables have been computed to accompany the
text C. Dougherty Introduction to Econometrics (second edition 2002,
Oxford University Press, Oxford),
334
Fox, John . 2010. Dummy-Variable Regression, Notes. York SPIDA
Mason, R.D & Douglas A. Lind. 1996. Teknik Statistik Untuk Bisnis dan
Ekonomi. Penerbit Erlangga, Jakarta
335
Rosadi, Dedi. 2011. Ekonometrika & Analisis Runtun Waktu Terapan
dengan R. Yogyakarta: C. V. Andi Offset.
336