Anda di halaman 1dari 34

Regresi dengan respon

kualitatif
Tujuannya:
Untuk menentukan probabilitas
individu dengan pendapatan yg
dimilikinya dalam keputusan yg
bersifat kualitatif
Misalnya:keputusan suatu
keluarga untuk membeli
rumah, jawaban yg kita dapat
ya atau tidak

Dengan kata lain respon sebuah


keluarga bersifat dikotomis
(binary)
Kita buat suatu pernyataan :
• Keluarga yg berpenghasilan tinggi lebih
besar kemungkinannya untuk membeli
rumah dari pada keluarga berpenghasilan
rendah.
• Contoh :
• Keluarga berpenghasilan 15 juta/bln
mempunyai probabilitas untuk membeli
rumah sebesar 0,8,sedangkan keluarga yg
berpendapatan 3 juta mempunyai
probabilitas 0,2
• Secara umum model ini ingin mencari
hubungan antara pendapatan yg dimiliki
dan probabilitasnya untuk membuat
keputusan yg bersifat dikotomi/binary
• Pertanyaannya : Bagaimana kita
mengestimasi model regresi ini ? Ada
beberapa pendekatan.
1. Model probabiliti linear
2. Model logit
3. Model probit
1. Model probabilitas linear
(LPM)
• Yi=β0+β1Xi + ei………………………….1.1
• Di mana :
• Y = 1 jika memiliki rumah
• 0 tidak memiliki rumah
• X = pendapatan keluarga
• e = Variabel error e= 0
• E(Yi| Xi)=β0+β1Xi
Jika Pi = probabilitas dari Y=1
(individu yg memiliki rumah dan
(1-Pi) =probabilitas dari Y=0
individu yg tidak memiliki
rumah,maka
E(Yi|Xi)=1(Pi)+0(1-Pi) =Pi
• Dengan demikian nilai harapan
kondisional dari persamaan 1.1 dapat
diinterpretasikan sebagai probabilitas
kondisional dari Y karena probabilitas Pi
harus bernilai 0 dan 1 maka 0≤E (Yi| Xi)≤1
• Karena model LPM sama dengan
model regresi linear maka metoda
OLS dpt digunakan untuk
menyelasaikan nya,namun model ini
Punya beberapa kelemahan :
1. Variabel gangguan ( ei) tidak berdistribusi
normal,tapi mengikuti distribusi binomial
(bernoulli) karena hanya memiliki dua nilai 0
dan 1, penggunaan distribusi binomial tidak
menimbulkan masalah,jika tujuan OLS hanya
sekedar estimasi bukan untuk inferensi,tetap
menghasilkan estimator BLUE,disamping itu
jika data terus ditambah mengikuti law of large
number (LNN) maka estimator OLS cendrung
terdistribusi normal.
2. Varian dari variabel gangguan mengan
dung unsur heteroskedastisitas
E (ei)=0 dan cov(ei ,ej ) =0
3.E(Yi|Xi) tidak selalu terletak 0≤E (Yi| Xi)≤1
Salah satu cara mengatasinya dengan
menggunakan model logit atau
probit.
4.Nilai R2 diragukan kebenarannya
• Jika kita menggunakan model LPM
mengestimasi model ini maka R2 tidak
menjamin adanya koefisien determinasi yg
sedekat mungkin dengan
datanya,sebarandata dapat dilihat pada
gambar 1.1 hanya terletak didua titik
ekstrim yaitu 0 dan 1
• Y

0
Hasil regresi persamaan 1.1
• Ŷ =-0,3998+0,1137X
• t=(-3,4953) t=(8,1391
• R2=0,7029 F= 66,2443
• D=1,3752
• Ŷ =-0,3998+0,1137*9
• =-0,3998 + 1.0233
• = 0,6235 atau 62%
• X= pendapatn bertanda positif sesuai yg
diharapkan.Mlaui uji t variabel pendapatan ini
juga signifikan pada =1%.Besarnya intersep
-0,3998 menunjukkan besarnya
probabilitas individu mempunyai rumah
ketika tidak terjadi perubahan
pendapatan=0,karena probabiltas tdak
pernah negatif kita anggap nol.Nilai slope
0,1137 artinya jika terjadi kenaikan
pendapatan sebesar 1 juta maka rata-rata
probabilitas individu memiliki rumah akan
naik 11%
• Kita juga dapat mengestimasi nilai
probabilitas setiap rumah tangga dengan
pendapatan tertentu, misalnya X= 9juta
maka probabilitas memiliki rumah sebesar
11,37%*9 juta – 0,3998 =0,6235 artinya
jika individu pendapatannya 9 juta maka
kecendrungannya memiliki rumah sebesar
62%
Model logit
• Dlm model LPM jika pendapatan terus
meningkat maka probabilitas terus
mengalami kenaikan dlm jumlah yg
sama.Pada hal dlm realitanya,jika
pendapatan keluarga terus menaik maka
probabilitasnya juga semakin besar dan
jika sudah diatas pendapatan minimal
kenaikan pendapatan tdk banyak
mempengaruhi probabilitas untuk memiliki
rumah.
• Probabilitas seperti itu jelas tdk sesuai dng
fakta. Yg dibutuhkan adalah sebuah model
probabilitas yg mampu menjamin nilai
probabilitasnya terletak antar 0 dan 1
• Model Cummulative Distribution
Function(CDF) adalah sebuah model yg
mampu menjamin bahwa nilai
probabilitasnya terletak diantara 0 dan 1
shg dpt membuat model regresi variabel
dependen bersifat dikotomis terpenuhi.
• CDF memenuhi dua sifat :
1.Ketika Y naik maka Pi (Yi =1| Xi) akan
naik,tapi tdk pernah keluar dari interval 0
dan 1
2.Hub Pi dan Xi adalah non linear shg
tingkat perubahannya tidak sama,tapi
kenaikannya semakin besar dan kemudian
semakin kecil,begitu pula ketika nilai
probabilitasnya mendekati 1, tingkat
kenaikannya semakin kecil.
• Ada 2 yg memenuhi kreteria dari CDF
yaitu :
1.Model logit yg berkaitan dengan fungsi
probabilitas distribusi logistik.
2.Model pobit yg berkaitan dengan fungsi
probabilitas distribusi normal
Gambar 1:CDF
1 P

-∞ 0 +∞
Model fungsi probabilitas
logistik
• Pi =f (Zi) =(β0 +β1Xi) = 1/1+e-zi atau
1/1+e –β0+β1Xi ………….2.1
• dimana e merupakan logaritma natural
dengan nilai 2,718 dan Pi adalah
probabilitas seseorang membli rumah
pada tingkat pendapatn (X) tertentu.Nilai Z
terletak antara -∞ dan +∞ sedangkan Pi
terletak antara 0 dan 1
• Jika sisi kanan persamaan 2.1 dikalikan
dengan ez maka akan menghasilkan
persamaan (2.2) Pi=1/1+e-zi = ezi/1+ezi
sedangkan probabilitas tdk membeli
rumah (1-Pi) persamaan (2.3)
• 1-Pi =1-ezi/1+ezi = 1/1+ezi shg dari
persamaan 2.2 dan 2.3 dpt dihitung rasio
probabilitas membeli rumah dengan tidak
membeli rumah atau disebut Odds Rasio
(persamaan 2.4)
• Pi/1-Pi =(ezi /1+ezi)(1+ezi/1)=ezi ,,,,,,,2.4
(persamaan Odds Rasio),Kalau di
transpormasikan ke model logaritma
natural (Ln) menjadi sbb: ln (Pi/1-Pi)=Zi
atau ln (Pi/1-Pi)= β0+β1Xi
Model logit dengan 2 variabel
independen
• ln (Pi/1-Pi)=Zi =β0 +β1X1+β2X2 ……..2.5
• Di mana :
• Koefisien β1 mengukur perubahan probabilistik
ketika terjadi perubahan 1 unit X1 (pendapatan)
sedang variabel lain dianggap tetap. Misalkan
keputusan membeli rumah dengan tidak
membeli rumah ditentukan oleh pendapatan
dan status perkawinan, menghasilkan regresi
sbb:
• Zi = -0,5443 +0,0850X1i +1,1857X2i
jika pendapatan individu (X1)=10 juta dan
statusnya kawin maka Rasio probabilitas
memiliki rumah dengan tidak memiliki
rumah adalah :
Zi=-0,5443 +0,0850(10) + 1,1857(1)
=1,4914 shg nilai prediksi probabilitas
mempunyai rumah dengan tidak membeli
rumah adalah Pi=1/1+e-1,4912=0,8163
• Artinya probabilitas mempunyai rumah bagi
rumah tangga yg pendapatannya 10juta dan
status menikah sebesar 0,8163 sedangkan yg
tidak =1-Pi= 1-0,8163=0,1837
• anti log 0,0850=1,089 dan 1,185 =3,273
• Coba interpretasikan pengaruh pendapatan dan
status perkawinan terhadap keputusan membeli
dan tdk membeli rumah.
Mengestimasi model logit
bebeda dengan model OLS
• Model logit menggunakan metode
maximum likelihood dalam mencari
koefisien regresi shg probabilitas kejadian
dari variabel dependen bisa setinggi
mungkin atau bisa maximum.Besarnya
probabilitas yang maksimum disebut
dengan log of the likelihood(LL) ukuran
kebaikan grs regresi kalo dlm model OLS
dikenal dengan R2
Ada beberapa hal yg perlu dijelaskan dalam
metode Max Likelihood (ML)
1. Metode LM digunakan untuk sampel
besar shg stadart errornya adalah
asymtotik yg mengikuti distribusi
normal.sebagai konsekwensinya, tidak
lagi digunakan statistik t tapi stastik z
untuk mengevaluasi signifikansi dari
variabel penjelas terhadap variabel
dependen.
• 2. Tidak lagi menggunakan uji F seperti dlm
model OLS,tapi gunakan uji statistik Likelihood
Rasio (LR) yg mengikuti distribusi Chi square
(λ2) dengan df sebanyak jumlah variabel
penjelas tidak termasuk intersep(konstanta),
jika nilai hitung Chi square > dari nilai kritis
(tabel) maka hipotesa nol ditolak berarti semua
variabel penjelas secara bersama-sama
Mempengaruhi variabel dependen
3. Gunakan R2 Mc-Fadden untuk melihat
ketetapan grs regresi.
Gambar 2:CDF
1 P
Probit

Logit

-∞ 0 +∞
Model probit
• Model yg didasarkan pada fungsi
probabilitas distribusi normal. Gambar 2
dpt dilihat perbedaan fungsi logit dan
probit yaitu pada nilai probabilitas
mendekati angka 0 dan 1 model probit yg
mendekati angka 0 dan 1 mempunyai
tingkat penurunan yg lebih cepat dari
model logit
Model probit
• Pi(Yi=1|Xi)=Φ(β0+β1Xi)……………..3.1
• Merupakan persamaan nonlinear shg metode
yg digunakan untuk mengestimasi model probit
adalah metode maximum likelihood
(ML).Bagaimana menginterpretasikan model
ini? Nilai koefisien dlm model ini tdk dapat di
interpretasikan secara langsung seperti model
LPM,karena nilai probabilitas model ini berasal
dari probabilitas distribusi normal Z
• Yg hanya dpt di interpretasikan langsung
adalah arah hubungan nya saja.Jika
bertanda positi maka pendapatan
berpengaruh positif terhadap keputusan
membeli dan sebaliknya.