Anda di halaman 1dari 14

BAB 7

MODEL REGRESI
DENGAN RESPON KUALITATIF

MODEL regresi dengan respon kualitatif sering ditemui dalam


model ekonomi, misalnya mengenai keputusan suatu negara
untuk mengimpor kedelai. Variabel keputusan ini terdiri dari
dua macam (dikotomis/ biner) yaitu Y=0 untuk keputusan tidak
mengimpor, sedangkan Y=1 untuk keputusan mengimpor. Ke­
pu­tusan mengimpor kedelai dipengaruhi oleh variabel stok ke­
delai, harga beli dsb dimana variabel independen tersebut ber­
sifat kuantitatif. Contoh lain adalah mengenai keputusan sebuah
keluarga untuk membeli rumah yang dipengaruhi oleh besarnya
pendapatan setiap bulannya. Variabel dependen yang dalam
pem­bahasan ini disebut sebagai variabel respon tidak harus ber­
sifat dikotomis. Variabel respon kualitatif dapat juga bersifat
multi­kategori, misalnya mengenai keutusan memilih partai po­
litik. Di dalam bab ini akan dibahas beberapa pendekatan sta­
tistika untuk kasus model regresi dengan respon kualitatif, yaitu
model probabilitas linier, model logit, dan model probit.

7.1. MODEL PROBABILITAS LINIER


Model probabilitas linier (linear probability model/ LPM) meng­
asumsikan bahwa terdapat hubungan linier antara vaiabel inde­
penden dan nilai probabilitasnya. Sebagaimana contoh sebe­lum­
nya, variabel respon Y menunjukkan kepemilikan rumah dari
suatu keluarga, dengan Y=1 apabila memiliki rumah dan Y=0

89
apabila tidak memiliki rumah. Model regresinya dapat ditulis
sebagai berikut :
Yi=β1+β2 Xi+εi (7.1)
Dengan :
Y = 1, jika memiliki rumah
Y = 0, jika tidak memiliki rumah
X = 0, pendapatan keluarga
Model pada persamaan (7.1) sekilas memang seperti model
regresi linier,namun variabel responnya bersifat biner dan hu­
bungan antara pendapatan keluarga dan probabilitas kepe­milikan
rumah bersifat linier. Artinya semakin tinggi pendapatan sebuah
ke­luarga maka probabilitas untuk memiliki rumah juga semakin
tinggi. Dengan demikian model di atas disebut sebagai model pro­
ba­bilitas linier.
Model LPM memiliki sifat yang mirip dengan model regresi
linier biasa, sehingga OLS masih dapat digunakan. Namun model
LPM memiliki beberapa kelemahan, yaitu :
1. Residual (ei) tidak berdistribusi normal, namun berdistribusi
binomial. Distribusi error akan mengikuti distribusi dari
variabel responnya yang berdistribusi binomial. Sebenarnya
hal ini tidak akan begitu masalah apabila ukuran sampel yang
digunakan besar, karena apabila data yang digunakan se­
makin besar akan menuju distribusi normal.
2. Variansi dari residual menunjukkan terjadinya kasus he­
te­roskedastisitas. Adanya heteroskedastisitas pada model
LPM mengakibatkan estimasi parameter menjadi tidak efisien.
Untuk mengatasi hal tersebut digunakan metode Weighted
Least Square (WLS).
3. Nilai ܻ෠ tidak selalu di dalam interval 0≤ ܻ෠ ≤1. Apabila ܻ෠
ber­nilai kurang dari 1 atau negatif maka nilainya akan di­
asumsikan sama dengan 0, namun apabila nilai ܻ෠ lebih besar
daripada 1 maka akan diasumsikan nilainya sama dengan 1.

90 Anton Bawono & Arya Fendha Ibnu Shina


4. Nilai R2 tidak dapat dijadikan ukuran untuk melihat ke­se­
suaian model.
Contoh 1 :
Berikut ini disajikan data mengenai kepemilikan rumah (Y)
dan Pendapatan keluarga per bulan (X) dalam juta rupiah.
No Y X No Y X
1 0 2 26 0 4,9
2 0 2 27 1 5,2
3 1 4 28 1 5,8
4 1 5 29 0 4
5 1 6 30 1 3,7
6 1 4 31 0 4,1
7 1 3 32 0 2,9
8 0 1,5 33 0 3
9 1 4,5 34 1 5,5
10 1 6,3 35 1 3,8
11 1 5,7 36 1 4
12 1 4,2 37 1 4
13 1 4,3 38 0 2,1
14 1 3,3 39 1 4,3
15 1 3,3 40 1 4,4
16 1 4,6 41 1 4,1
17 0 4,1 42 0 3,5
18 1 2,8 43 1 4,3
19 1 7,7 44 0 4,6
20 1 6 45 0 5
21 1 4,1 46 1 5,8
22 0 3,6 47 1 4
23 1 5,1 48 0 3,8
24 1 4,7 49 1 4,1
25 1 5,5 50 1 5,3
Tabel 7.1 Data Kepemilikan rumah dan Pendapatan Keluarga

Model Regresi dengan Respon Kualitatif 91


Setelah dilakukan komputasi data dengan analisis regresi
menggunakan EVIEWS, didapatkan output sebagai berikut :

Gambar 7.1. Output Analisis Regresi

Berdasarkan output pada gambar 7.1, didapatkan model


regresi ܻ෠ =0,085 + 0,184 X. Nilai β1 = -0,085 artinya probabilitas
se­­buah keluarga untuk memiliki rumah dengan pendapatan 0
rupiah adalah sebesar -0,085. Nilai probabilitas tidak pernah
negatif, sehingga diasumsikan bahwa nilai probabilias men­
jadi 0 atau berarti tidak memiliki rumah. Nilai Prob(F-statistic)
=0,000472 berarti model yang digunakan cocok, namun perlu
diwaspadai pula bahwa nilai R2 rendah yaitu sebesar 0,226854.
Hal ini berarti kesesuaian model tidak baik dan ada indikasi
ter­jadi heteroskedastistitas. Indikasi mengenai adanya hetero­
skedastisitas diperkuat dengan scatter plot yang berpola pada
gambar 7.2, 7.3, dan 7.4 serta uji Glejser yang terdapat pada gmbar
7.5. Gejala heteroskedastisitas dapat diatasi dengan Weighted
Least Square (WLS).

92 Anton Bawono & Arya Fendha Ibnu Shina


Gambar 7.2 Scatter Plot X dan Y

Gambar 7.3 Scatter Plot ܻ෠ dan e2

Model Regresi dengan Respon Kualitatif 93


Gambar 7.4 Scatter Plot X dan e2

Gambar.7.5 Output Uji Glejser

94 Anton Bawono & Arya Fendha Ibnu Shina


7.2. MODEL LOGIT
Model logit (Logistic Regression) memperbaiki kelemahan
yang ada pada model LPM. Model logit menggunakan fungsi
logit. Untuk memahami fungsi logit, digunakan contoh sebelum­
nya mengenai probabilitas kepemilikan rumah (Pi) berdasarkan
tingkat pendapatan (Xi). Model fungsi probabilitasnya adalah
sebagai berikut :
ܲ௜ ൌ ‫ܧ‬ሺܻ ൌ ͳȁܺ௜ ሻ ൌ ߚଵ ൅ ߚଶ ܺ௜ ൅ ߝ௜  (7.2)
X adalah pendapatan keluarga, sedangkan Y = 1 adalah keluarga
yang memiliki rumah. Jika persamaan (7.2) diubah menjadi :
ͳ
ܲ௜ ൌ ‫ܧ‬ሺܻ ൌ ͳȁܺ௜ ሻ ൌ 
ͳ൅ ݁ ିሺఉభ ାఉమ ௑೔ ሻ (7.3)
Dengan Z=β1+β2X, maka persamaan (7.3) dapat disederhanakan
menjadi :
ͳ ݁௓
ܲ௜ ൌ ൌ 
ͳ ൅ ݁ ି௓ ͳ ൅ ݁ ௓ (7.4)
Persamaan (7.4) disebut sebagai fungsi ditribusi kumulatif logistik
atau model logit. Jika Pi adalah probabilitas sebuah keluarga me­
miliki rumah, maka 1-Pi adalah probabilitas keluarga tidak me­
miliki rumah dapat ditulis sebagai berikut :

݁ ି௓ ͳ
ͳ െ ܲ௜ ൌ ൌ 
ͳ ൅ ݁ ି௓ ͳ ൅ ݁ ௓ (7.5)
Dengan demikian dapat dituliskan pula menjadi :
ܲ௜
ൌ ݁௓
ͳ െ ܲ௜ (7.6)
Jika persamaan (7.6) dikalikan dengan logaritma natural (Ln),
akan menjadi :

Model Regresi dengan Respon Kualitatif 95


ܲ௜
‫ܮ‬௜ ൌ ‫ ݊ܮ‬൬ ൰ ൌ ܼ௜ ൌ ߚଵ ൅ ߚଶ ܺ௜ 
ͳ െ ܲ௜ (7.7)
Model logit dapat diterapkan dalam dua kondisi, yaitu
pada kondisi data berkelompok dan data individual. Pada data
berkelompok estimasi model menggunalan OLS, sedangkan
pada data individual menggunakan ML.

1. Model Logit untuk Data Berkelompok


Penggunaan metode logit untuk dta berkelompok perlu di­
lakukan penyesuaian, yaitu dengan metode Group Logit atau
sering disebut sebagai GLOGIT. Sebagai contoh data pada table
7.2 yang menunjukkan banyaknya orang yang memiliki dan tidak
memiliki rumah.
Contoh 2 :
Xi Ni ni
8 40 10 Xi : Penghasilan perbulan
10 30 15 (juta rupiah)
12 55 20 Ni : banyaknya responden
14 65 25 ni : banyaknya responden
yang memiliki rumah
16 30 17
18 25 20
20 35 32
22 47 38
24 40 37
26 10 8

Tabel 7.2 Data Kepemilikan Rumah

Data pada table 7.2 dapat dianalisis dengan metode glogit


menggunakan OLS biasa, namun jika terdapat heteroskedastisitas
maka harus digunakan WLS. Langkah analisis WLS dengan ban­
tuan MS Excel adalah langkah-langkah sebagai berikut :

96 Anton Bawono & Arya Fendha Ibnu Shina


ܲ௜
a. Hitunglah nilai Pi dengan rumus
ͳ െ ܲ௜
ܲ௜
b. Hitunglah nilai 1-Pi dan
ͳ െ ܲ௜
ܲ௜
c. Hitunglah nilai Li dengan rumus ‫ܮ‬௜ ൌ ‫ ݊ܮ‬൬ ൰
ͳ െ ܲ௜
ܲ
d. Hitunglah nilai Wi dengan rumus ܹ௜ ൌ ܰ௜ ‫ כ‬൬ ௜ ൰
ͳ െ ܲ௜
e. Hitunglah nilai ඥ ܹ ௜

f. Hitunglah nilai
‫ܮ‬௜ ‫ כ‬ඥܹ௜

g. Hitunglah nilai
ܺ௜ ‫ כ‬ඥܹ௜

Li= Wi=
Pi/ Li*= Wi*=
i Xi Ni ni Pi 1-Pi ln(Pi/ Ni*(Pi/ √Wi
(1-Pi) Li*√Wi Xi*√Wi
(1-Pi)) (1-Pi))
1 8 40 10 0,250 0,750 0,333 -1,099 13,333 3,651 -4,012 29,212
2 10 30 15 0,500 0,500 1,000 0,000 30,000 5,477 0,000 54,772
3 12 55 20 0,364 0,636 0,571 -0,560 31,429 5,606 -3,137 67,273
4 14 65 25 0,385 0,615 0,625 -0,470 40,625 6,374 -2,996 89,233
5 16 30 17 0,567 0,433 1,308 0,268 39,231 6,263 1,680 100,215
6 18 25 20 0,800 0,200 4,000 1,386 100,000 10,000 13,863 180,000
7 20 35 32 0,914 0,086 10,667 2,367 373,333 19,322 45,737 386,437
8 22 47 38 0,809 0,191 4,222 1,440 198,444 14,087 20,290 309,915
9 24 40 37 0,925 0,075 12,333 2,512 493,333 22,211 55,801 533,067
10 26 10 8 0,800 0,200 4,000 1,386 40,000 6,325 8,768 164,438

Variabel yang diinginkan untuk analisis dengan WLS sudah


didapatkan, yaitu pada dua kolom terakhir. Selanjutnya kedua
variabel tersebut akan diinput ke dalam EVIEWS. Berikut adalah
langkah-langkah yang perlu dilakukan :
a. Klik Quickà Empty Group (Edit Series) sehingga akan
tampak kolom untuk mengisi data.

Model Regresi dengan Respon Kualitatif 97


Gambar 7.6 Tampilan workfile yang siap diisi data

b. Berikan nama variabel dengan klik kanan kemudian pilih


Insert Series kemudian isikan Li kemudian klik OK. Isikan
data Li* pada lembar MS Excell. Lakukan hal yang sama untuk
variabel Xi. Sehingga tampilan akan berubah menjadi seperti
pada gambar 7.7 berikut :

Gambar 7.7 Tampilan Workfile dengan variabel Li dan Xi

98 Anton Bawono & Arya Fendha Ibnu Shina


c. Jalankan regresi OLS dengan persamaan li c xi. Maka akan
didapatkan hasil regresi seperti pada gambar 7.8.

Gambar 7.8 Tampilan Hasil Regresi

Gambar 7.9 Tampilan Hasil Uji Glejser

Model Regresi dengan Respon Kualitatif 99


Interpretasi hasil regresi pada gambar 7.8 adalah nilai koefi­
sien Xi sebesar 0,125 menunjukkan bahwa kenaikan gaji sebesar
1 juta akan meningkatkan kemungkinan memiliki rumah sebesar
12,5%. Hasil regresi pada gambar 7.8 sudah bebas dari masalah
heteroskedastisitas, hal ini dibuktikan dengan hasil uji Glejser
yang Nampak pada gambar 7.9.

2. Model Logit untuk Data Individual


Langkah-langkah pengolahan data pada model logit dengan
data individual menggunakan EVIEWS adalah sebagai berikut :
1. Bukalah data pada contoh 1
2. Klik Quick à Estimate Equation… lalu isikan y c x pada
Equation Estimation
3. Pilihlah BINARY-Binary Choice (Logit, Probit, Extreme
Value) pada Estimation settings-Method

Gambar 7.10 Menentukan pilihan metode untuk logit

100 Anton Bawono & Arya Fendha Ibnu Shina


4. Pilihkan Logit pada Binary estimation method
5. Klik OK

Gambar 7.11 Output untuk analisis logit

Berdasarkan output pada gambar 7.11 didapatkan persamaan


sebagai berikut :
ܲ௜
‫ܮ‬௜ ൌ ‫ ݊ܮ‬൬ ൰ ൌ ܼ௜ ൌ ߚଵ ൅ ߚଶ ܺ௜
ͳ െ ܲ௜
= -4,043619 + 1,215435X (7.8)

Model pada persamaan (7.8) di atas dapat digunakan untuk


prediksi. Misalkan apabila sebuah keluarga memiliki pendapatan
Rp5 juta setiap bulan, berapa besarkah kemungkinan keluarga
tersebut memiliki mobil?
ܲ
‫ ܮ‬ൌ ‫ ݊ܮ‬൬ ൰ ൌ െͶǡͲͶ͵͸ͳͻ ൅ ͳǡʹͳͷͶ͵ͷሺͷሻ ൌ ʹǡͲ͵͵ͷͷ͸
ͳെܲ

Model Regresi dengan Respon Kualitatif 101


ܲ
൬ ൰ ൌ ݁ ଶǡ଴ଷଷହହ଺ ൌ ͹ǡ͸ͶͳʹͳͲʹͶͺ ൎ ͹ǡ͸Ͷͳ
ͳെܲ
͹ǡ͸Ͷͳ
ܲൌ ൌ ͲǡͺͺͶʹ͹
ͳ ൅ ͹ǡ͸Ͷͳ

Artinya jika sebuah keluarga memiliki pendapatan perbulan


sebesar Rp5 juta kemungkinan untuk memiliki rumah adalah se­
besar 88,427%.
Uji kesesuaian model (Godness-of-Fit Test) pada model logit
menggunakan uji Hosmer Lemeshow. Caranya adalah dengan
klik View à Godness-of-Fit Test (Hosmer-Lemeshow), kemu­
dian klik OK pada Godness-of-Fit Test. Hasilnya terdapat pada
gambar 7.12.

Gambar 7.12. Output Uji Hosmer-Lemeshow

Berdasarkan uji Hosmer-Lemeshow, didapatkan nilai Prob.


Chi-Sg (8) pada H-L Statistic sebesar 0,3951>. Dengan demikian
dapat disimpulkan bahwa model sudah sesuai atau signifikan.

102 Anton Bawono & Arya Fendha Ibnu Shina

Anda mungkin juga menyukai