Anda di halaman 1dari 9

Nama : Ivan S.

Tanujaya
NRP : H14080118

Pelanggaran Asumsi

Asumsi yang harus dipenuhi Pelanggaran Akibat

Variabel X merupakan Fixed Multikolinearitas Parameter regresi tidak dapat diduga


Variable, tidak ada korelasi (R2 Tinggi, atau dapat diduga tapi menghasilkan
antara variabel bebas tapi variabel tidak standard error yang besar, maka thit
ada yang nyata) menjadi tidak signifikan

Berbias Model tidak mampu menggambarkan


rataan sama
kondisi yang sebenarnya
dengan nol (tidak berbias)

Penduga Koefisien tidak efisien


Homoskedastisitas Heteroskedastisitas

Ada Autokorelasi Penduga koefisien tidak efisien


,
(Tidak ada autokorelasi)

Tidak menyebar Uji-t tidak bisa dilakukan


(Residual menyebar normal) normal

3 pelanggaran asumsi :
1. Multikolinearitas (ada masalah antar variabel bebas – independent)
2. Heteroskedastisitas (ada masalah dengan residua/ error)
3. Autokorelasi (ada masalah dengan residual/error)

Multikolinearitas
Adanya korelasi yang sangat tinggi antar variabel bebas.

Contoh :

Macam Multikolinearitas…

 Sempurna -1 /1

 Tidak sempurna / serius; mendekati -1 atau 1

Akibat multikolinearitas
 Jika multikolinearitas sempurna,
Maka penduga koefisien regresi tidak dapat diestimasi dengan metode OLS
Contoh : y=f(x1,x2,x3);

Model regresi menjadi karena X2 dapat langsung dihilangkan

Jika multikolinearitas tidak sempurna,


Maka penduga koefisien regresi sulit diinterpretasi, dikarenakan tidak asumsi ceteris paribus
tidak berlaku

Contoh :

Maka jika X1 naik, maka X2 ikut naik.


Inter pretasi b1 = jika x1 naik 1 satuan maka Y naik b1 satuan, tetapi tidak ceteris paribus
dikarenakan x2 ikut naik.

 Var(bi) menjadi sangat besar maka terjadi overestimate


Sehingga t-hitung menjadi sangat kecil, menjadi underestimate / tidak signifikan.
Kenapa?

Karena sesuai rumus , nilai mendekati satu dikarenakan adanya

multikolenearitas, sehingga nilai mendekati nol (0), sehingga nilai Var(bi)


menjadi sangat besar (overestimate)

Sementara itu rumus untuk t-hitung

, sementara itu nilai sangat besar, sehingga nilai t-hitung


menjadi sangat kecil (underestimare/tidak signifikan)

Efeknya adalah banyak peubah X yang tidak signifikan terhadap Y, sekalipun nilai R 2 sangat
tinggi.

Dan nilai menjadi lebih tinggi dari nilai sesungguhnya.

 Tanda koefisien regresi tidak sesuai dengan teori ekonomi atau bilamana dengan korelasi
dengan korelasi parsial x terhadap y
Contoh :
y= b0+b1X1+e ; rx1y = +
y= b0+b2X2+e ; ; rx2y = +
y= b0+b1X1-b2X2+e
Nilai koefisien b2 yang tiba-tiba berubah menjadi indikasi adanya masalah pelanggaran
asumsi.

Cara mendeteksi multikolinearitas


 Nilai R2 sangat tinggi, namun banyak peubah X yang tidak signifikan terhadap Y. (syarat
cukup)
 Uji koefisien korelasi (pearson) sederhana antar peubah bebas (syarat cukup). Namun masih
dalam perdebatan besaran yang menyatakan adanya korelasi antar variabel bebas
 Mencari nilai VIF (Variance Inflation Factor), syarat perlu.

VIF= ,
Contoh…….
MD=f(i,Y)
MD=a0+a1it+a2Yt+e

Regresi it=a0+a1Yt+e, nilai R2 menjadi nilai

= didapat dari informasi sebelumnya.


jika VIF>10, maka terjadi multikolinearitas.

Cara Mengatasi Multikolinearitas


1. Memanfaatkan informasi sebelumnya.
Kelemahan : informasi sebelumnya belum tentu ada
2. Mengeluarkan peubah bebas yang memiliki kolinearitas tinggi, namun harus berhati2 karna
mungkin dikarenakan kesalahan bentuk model
3. Transformasi menjadi peubah pembeda pertama (First Difference), namun hanya bisa
digunakan untuk persamaan jangka pendek
4. Menggunakan regresi komponen utama, namun menghasilkan penduga koefisien yang
berbias
5. Memakai panel data
6. Menambah data baru.

Heteroskedastisitas
Asumsi yang harus dipenuhi Pelanggaran Akibat

Penduga Koefisien tidak efisien


Homoskedastisitas Heteroskedastisitas

Sering terjadi pada data cross section, namun tidak menutup kemungkinan terjadi di data time
series.
Ada hubungannya dengan error yang semakin mengecil atau membesar dengan semakin besar atau
kecilnya nilai peubah bebas.(alias ragam residual tidak konstan)

Akibatnya….

 masih
Nilai

Tidak bias (nilai mendekati nilai true β, jika dilakukan sampling berulang kali dengan (n)

yang sama)

Konsisten, (jika (n) ditambah sampai tak hingga maka rata2 akan mendekati β

sebenarnya.

Namun tidak efisien(ragamnya tidak konstan)

Karena….

mengalami underestimae, sehingga

thitung mengalami overestimate.

Maka dari itu tetap tidak bias, konsisten, namun tidak efisien.

Cara Mendeteksi
1.
Scatter plot (informal)
2.
Uji Park – uji spearman
3.
Uji Gletser
4.
Uji Goldfelf Quandt
5.
Uji Breasch Pagan
6.
Uji White

Tahapan Uji Goldfeld-Quandt


1.
Urutkan variabel independen
2.
Hilangkan data independen(entah berapa) yang berada di tengah
3.
Duga masing-masing model regresi untuk masing2 kelompok dengan OLS
4.
Cari nilai KTS masing-masing regresi
KTS=
5.
Asumsikan bahwa masing2 kelompok tidak mempunyai autokorelasi, maka cari Fhitung

Fhitung=

6.
Bandingkan dengan Ftabel= , dengan hipoteris…

Ho=Homoskedastisitas

H1=Heteroskedastisitas

Dengan kesimpulan

, maka tolak Ho

D=jumlah pengamatan yang dibuang

K= jumlah konstanta

Tahapan uji Breuss-Pagan


1.
Duga model regresi yang mau dianalisis
2.
Cari nilai error e=

3.
Cari ragam sisaan
4.
Duga model regresi

5.
Cari nilai (JKR/2) bandingkan dengan nilai
6.
Uji hipotesis

Ho=Homoskedastisitas

H1=Heteroskedastisitas

Dengan kesimpulan

, tolak Ho
Tahapan uji White
1.
Ikuti tahap 1,2,3 dari uji Breuss-Pagan
2.
Cari Model

Dan, cari nilai R2

3.
Bandingkan dengan
4.
Uji hipotesis

Ho=Homoskedastisitas

H1=Heteroskedastisitas

Dengan kesimpulan

nR2> , maka tolak Ho

Cara Mengatasi Heteroskedastisitas

Dengan metode GLS atau WLS

Contoh…

Y=b0+b1x1+b2+ei

Diketahui ada heteroskedastisitas, dan nilai Var(ei)=

Masing-masing variabel dependen dan independen dibagi

Model GLS

Buktinya…
Maka diketahui bahwa ragam langsung konstan

Autokorelasi
Adalah adanya korelasi yang kuat antar data pada residual dimana e t tergantung pada et-1. Maka dari
itu autokorelasi sering terjadi pada data time series.
Cov (ei,ej)=E(ei,ej)≠0, i≠j

Konsekuensi = dugaan tidak berbias, masih konsisten, tidak efisien. Sehingga Var(e i) bias kebawah
atau underestimate dan t-hitung menjadi overestimate.
Bisa diabaikan jika tujuannya untuk peramalan, namun jadi masalah untuk menduga.

Cara mengetahuinya…
1. Plot data residual
2. Durbin Watson test
Mencari nilai p

Cara mengatasinya…
1. Jika nilai p diketahui, gunakan generalized differencing
2. Jika nilai p tidak diketahui, gunakan…
 Prosedur Cochrane-Orcutt
Namun prosedur ini tidak menjamin sisaan akan minimum
 Prosedur Hildreth-Lu
Jika dilakukan secara teliti, dapat mencapai sisaan minimum.
Dikenal dengan metode likelihood

Regresi Logistik
Adalah ketika regresi yang dilakukan pada data kategorik, untuk mendapatkan perbandingan antara
1 dan 0.

Model : Y=

Uji pada Regresi Logistik


1. Uji G (sama seperti uji F pada regresi linear.
Hipotesis
Ho= semua intersep yang bernilai nol.
H1= setidaknya ada satu intersep yang tidak bernilai nol
G-stat>X2α, maka tolak Ho
Pvalue< α, maka tolak Ho

2. Uji Wald, sama seperti uji t


Hipotesis =
Ho=intersep x berpengaruh nyata
H1=intersep x tidak berpengaruh nyata
Zhitung =wald = (bi/Se bi)
Zhitung > Zα/2 , maka tolak Ho

Binary Logistic Regression: purchase versus age; gender; income

Link Function: Logit

Response Information

Variable Value Count


purchase 1 162 (Event)
0 269
Total 431

Logistic Regression Table

Odds 95% CI
Predictor Coef SE Coef Z=Wald P Ratio Lower Upper
Constant -2,11159 0,753983 -2,80 0,005
age 0,0251874 0,0179264 1,41 0,160 1,03 0,99 1,06
gender
1 0,511114 0,209469 2,44 0,015** 1,67 1,11 2,51
income
1 0,100556 0,263395 0,38 0,703 1,11 0,66 1,85
2 0,786742 0,252925 3,11 0,002** 2,20 1,34 3,61

Keterangan : ** significant
Log-Likelihood = -276,104
Test that all slopes are zero: G = 18,441, DF = 4, P-Value = 0,001

1. Uji-G
Berdasarkan uji-g diperoleh nilai G=18.441
p-value(0.001)< alpha 10% maka tolak H0 artinya model significant

2. Uji Wald
a. Gender memiliki p-value(0.015) < alpha 10% artinya gender berpengaruh nyata terhadap
purchase. Nilai odds ratio 1.67 artinya peluang seorang wanita untuk membeli adalah
1.67 kalinya peluang seorang laki-laki untuk membeli. Atau kecenderungan wanita untuk
membeli lebih tinggi dibanding laki-laki.
b. Income high memiliki p-value(0.002) < alpha 10% artinya income high berpengaruh
nyata terhadap purchase. Nilai odds ratio 2,20 artinya peluang seorang yang memiliki
income high untuk membeli adalah 2.20 kalinya peluang seorang yang memiliki income
low untuk membeli. Atau kecenderungan orang yang memiliki high income untuk
membeli lebih tinggi dibanding yang low income.

Anda mungkin juga menyukai