Anda di halaman 1dari 18

POKOK BAHASAN VII

REGRESI DENGAN VARIABEL DUMMY / INDIKATOR

Section I.1 PENDAHULUAN


7.1.1. Deskripsi Singkat
Pokok bahasan ini membicarakan tentang: definisi dan notasi model
regresi linier dengan variabel bebas maupun variabel respon dummy,
estimasi model probabilitas linier (model logistik).

7.1.2. Relevansi
Regresi dengan variabel dummy dapat digunakan untuk menyatakan
hubungan fungsional antara beberapa variabel regressor terhadap satu
variabel respon dengan melibatkan variabel bebas atau variabel tak
bebas dummy yang merupakan variable kualitatif.

7.1.3. Kompetensi Dasar


Setelah mengikuti kegiatan perkuliahan ini, mahasiswa diharapkan
mampu:
a) menjelaskan pengertian dan notasi-notasi model regresi linier
dengan variabel dummy
b) menentukan hubungan fungsional antara beberapa variabel bebas
(prediktor) terhadap satu variabel tak bebas (respon) atau
menyusun model regresi linier berganda yang melibatkan variabel
bebas dummy.
c) menentukan hubungan fungsional antara beberapa variabel bebas
(prediktor) terhadap satu variabel tak bebas (respon) atau
menyusun model regresi linier berganda yang melibatkan variabel
terikat dummy
d) membuat prediksi menggunakan model regresi linier yang
melibatkan variabel dummy dalam kehidupan sehari-hari.

Section I.2 PENYAJIAN


7.1.4. Regresi dengan Variabel Bebas Dummy/Indikator
Pada pembahasan terdahulu, persamaan regresi yang dipelajari hanya
menunjukkan hubungan fungsional antara variabel numerik baik untuk
variabel bebas maupun tak bebas. Dalam mengungkapkan suatu fenomena
di sekitar kita, seringkali dibutuhkan veriabel selain numerik, yang salah
satunya adalah variabel kategorik. Dalam regresi variabel kategorik yang
diberi harga nol atau satu biasa disebut variabel dummy / indikator / biner /
kualitatif / boneka / dikotomi. Dalam penerapannya, variabel dummy
digunakan untuk mengkuantitatifkan data kualitatif, seperti: jenis kelamin,
pendidikan, status perkawinan, kualitas produk, kepuasan pelayanan dan
sebagainya.
Model regresi dapat hanya menggunakan variabel dummy/indikator
sebagai variabel bebas, tetapi dapat pula disertai variabel bebas lain yang
numerik.
Contoh 1:
Sebuah perusahaan parfum ingin melakukan marketing research. Segmen
pasar yang dimaksud diukur berdasarkan daerah tempat tinggal responden
(kota dan desa) dan harga produk. Akan dilihat ada hubungan antara daerah
tempat tinggal responden dengan harga produk.
Model regresi yang digunakan untuk melakukan analisis terhadap
informasi yang didapat adalah :
Y   0  1 D  

Y : harga produk
D : daerah tempat tinggal
D = 1 : kota
D = 0 : desa
 : kesalahan random
Dari model tersebut, harga produk rata-rata yang dipilih adalah:
1. Kota : E(Y|D=1)
2. Desa : E(Y|D=0)

Jika  1  0 maka terdapat perbedaan rata-rata harga produk antara


responden yang tinggal di kota dan responden yang tinggal di desa. Dengan
kata lain, berbagai jenis produk mempunyai segmen pasar yang bebeda.
Sebagai contoh, apabila diperoleh estimasi model regresi:
Y : 9,4 + 16 D
dengan nilai thitung = 53,22 untuk  0 dan thitung = 6,245 untuk  1 serta
koefisien determinasi R2 : 96,54 % maka dari taksiran tersebut diperoleh
bahwa  0  0 dan  1  0 . Hal ini berarti bahwa rata-rata harga parfum: Y=
(9,4+16) ribu = 25,4 ribu untuk responden perkotaan, sedangkan untuk
responden pedesaan sebesar 9,4 ribu. Tetapi dalam interpretasi harus hati-
hati sebab faktor-faktor lain dianggap konstan, misalnya : selera, gaya hidup,
pendidikan dan sebagainya.

Contoh 2:
Misalkan ada sebuah isu bahwa masih ada perbedaan upah karyawan laki-
laki dan wanita. Untuk hal itu dibuat analisis gaji tahunan untuk laki-laki dan
wanita yang bekerja sebagai dosen PTS di Jakarta. Besar kecilnya gaji
ditentukan pula oleh faktor pengalaman kerja.
Model regresi yang diformulasikan adalah :
Y   0  1 X   2 G  

Y : gaji tahunan
X : lama mengajar
G = 1 ; untuk dosen laki-laki
G = 0 ; untuk dosen wanita

Dari model tersebut diperoleh bahwa :


1. Rata-rata gaji dosen wanita : Y   0  1 X
2. Rata-rata gaji dosen laki-laki : Y   0   1 X   2

Sebagai contoh, misalnya berdasarkan data diperoleh suatu model


regresi:
Y = 19,21 + 0,373 G + 1,453 X
dengan nilai thitung = 11,33 untuk  0 , thitung = 1,141 untuk  2 dan thitung = 37,997
untuk  1 serta koefisien determinasi R2 : 89, 75 % maka berdasarkan uji t
variabel G tidak berpengaruh secara signifikan terhadap rata-rata gaji dosen
di Jakarta. Dengan demikian tidak ada perbedaan antara rata-rata gaji dosen
laki-laki dan wanita.
Apabila variabel bebas yang terlibat dalam model mempunyai kategori
lebih dari dua (katakanlah k kategori), maka variabel dummy yang dapat
dibentuk adalah sebanyak (k-1). Sebagai contoh, misalnya variabel
“pendidikan” dikategorikan menjadi 3 kelompok: tidak tamat SMU, tamat SMU
dan tamat PT, maka dibutuhkan 2 variabel dummy, yaitu:
D2 = 1, tamat SMU
= 0, lainnya
D3 = 1, tamat PT
= 0, lainnya
Sedangkan kelompok dengan pendidikan tidak tamat SMU disebut grup
dasar. Sebagai ilustrasi, perhatikan contoh berikut.
Contoh 3.
Jika diberikan data tingkat pendidikan sejumlah karyawan suatu instansi,
maka vriabel dummy yang dimasukkan dalam model, dapat didefinisikan
sebagai berikut.

Tabel 7.1. Nama karyawan dan tingkat pendidikan


No Nama Pendidikan D2 D3
1 Ana SD 0 0
2 Annisa PT 0 1
3 Budi SMU 1 0
4 Bambang SD 0 0
5 Badrun SLTP 0 0
6 Betty SMU 1 0

Lebih lanjut apabila akan dibuat model regresi untuk melihat pola
pengeluaran kesehatan berdasarkan tingkat pendidikan dan pendapatan
maka model yang dapat diformulasikan adalah:
Y   0  1 X   2 D2   3 D3  

Y: pengeluaran untuk kesehatan


X: pendapatan per tahun
D2 = 1: pendidikan tertinggi SMU
0: lainnya
D3 = 1: pendidikan tertinggi PT
0: lainnya
Dari model tersebut, rata-rata pengeluaran kesehatan seseorang berdasarkan
tingkat pendidikannya adalah:
o Tidak tamat SMU: Yˆ  ˆ0  ˆ1 X

o Tamat SMU: Yˆ  ˆ0  ˆ1 X  ˆ2

o Tamat PT : Yˆ  ˆ0  ˆ1 X  ˆ3

7.1.5. MODEL REGRESI DENGAN VARIABEL TERIKAT DUMMY

7.1.5.1. LATAR BELAKANG


Pada bab-bab terdahulu, model-model regresi yang dibahas
merupakan model-model dengan variabel terikat numerik (bukan kategorik).
Dalam bagian ini, akan dibahas model-model dengan variabel terikat dummy
atau kategorik. Pembahasan akan difokuskan pada: (i) kasus-kasus yang
dapat dikategorikan pada pemodelan khusus ini, (ii) bentuk model yang
ditawarkan, (iii) masalah dari pemodelan tersebut, dan (iv) apakah metode
OLS (Ordinary Least Square) masih dapat dimanfaatkan untuk
mengestimasi model tersebut.
Sebagai ilustrasi, model ini muncul pada kasus-kasus seperti berikut ini.
Misalkan ingin dipelajari partisipasi wanita dewasa pada angkatan kerja
(labor force participation of adult females) sebagai fungsi dari rata-rata
tingkat upah, pendapatan suami, umur, banyaknya anak usia sekolah, dan
lain-lain. Telah diketahui bahwa seseorang bisa menjadi angkatan kerja, bisa
pula tidak. Oleh karena itu, variabel terikatnya yaitu partisipasi angkatan
kerja wanita dapat diasumsikan berharga 1 bila orang tersebut berada dalam
angkatan kerja dan diasumsikan berharga 0 bila orang tersebut tidak berada
dalam angkatan kerja.
Model ini juga dapat dipakai untuk menganalisis apakah seorang
buruh/pekerja menjadi anggota dari suatu serikat pekerja atau tidak.
Keanggotaan ini dapat tergantung pada beberapa variabel yang kualitatif
dan kuantitatif. Dalam kasus ini, dapat dimodelkan dengan variabel
terikatnya berupa keikutsertaan seseorang dalam suatu serikat pekerja
misalnya Serikat Pekerja Sejahtera Indonesia (SPSI). Kita dapat
mendefinisikan bahwa bila seseorang menjadi anggota SPSI, variabel
terikatnya dapat diasumsikan berharga 1 dan bila orang tersebut tidak
menjadi anggota SPSI, variabel terikatnya dapat diasumsikan berharga 0.
Selain itu, kita juga dapat mengamati hubungan antara pernah tidaknya
melakukan perjalanan ke luar negeri dan faktor yang mempengaruhinya.
Perjalanan ke luar negeri ini dapat tergantung pada beberapa faktor seperti
pendapatan, jenis pekerjaan, dan lain lain. Sedangkan variabel terikat
perjalanan ke luar negeri dapat di asumsikan berharga 1 bila seseorang
pernah melakukan perjalanan ke luar negeri dan berharga 0 bila seseorang
belum pernah melakukan perjalanan ke luar negeri. Dengan demikian,
variabel terikatnya berbentuk variabel dummy.
Masih banyak contoh lain yang variabel terikatnya berupa variabel
dummy atau variabel dikotomi. Seperti, apakah suatu keluarga mempunyai
anak di bawah umur yang bekerja atau tidak; apakah seseorang mempunyai
asuransi jiwa atau tidak. Selain itu, kita juga dapat menganalisis apakah
suatu obat yang baru ditemukan efektif atau tidak. Dari contoh-contoh
tersebut di atas ada satu hal yang menarik untuk disimak, yaitu variabel
terikatnya merupakan suatu jawaban Ya atau Tidak atau berupa variabel
dikotomi. Masalahnya sekarang adalah bagaimana mengatasi model dengan
variabel terikat dikotomi tersebut. Lebih spesifik lagi, bagaimana
mengestimasi model-model tersebut. Apakah ada teknik tersendiri ataukah
model-model tersebut dapat diestimasi menggunakan teknik OLS yang telah
di pelajari. Untuk menjawab pertanyaan tersebut, akan dipaparkan
pendekatan yang sering digunakan untuk mengatasi masalah-masalah
tersebut.

7.1.5.2. PEMODELAN MATEMATIS DAN MASALAHNYA


Perhatikan kembali model regresi sederhana yang telah dianalisis:
Yi   0  1 X i   i (7.1)
X : pendapatan
Y : 1; bila seseorang pernah melakukan perjalanan ke luar negeri
0; bila seseorang tidak pernah melakukan perjalanan ke luar negeri
Mengacu pada model (7.1), secara statistik, ekspektasi bersyarat dari Y i, jika
diberikan Xi , yang biasa dinotasikan dengan E(Y i |Xi) dapat dicari sebagai
berikut:
E(Yi |Xi) = (Yi = 1).P(Yi = 1|Xi) + (Yi = 0).P(Yi = 0|Xi)
= P(Yi = 1 | Xi)

Ekspektasi bersyarat tersebut dapat juga diinterpretasikan sebagai


probabilitas bersyarat bahwa suatu peristiwa (seseorang pernah melakukan
perjalanan ke luar negeri) akan terjadi bila X (pendapatan) diketahui. Secara
notasi, dituliskan Pr(Yi=1|Xi) yang menyatakan probabilitas bahwa seseorang
pernah melakukan perjalanan ke luar negeri bila pendapatannya diketahui.
Dengan perkataan lain, ekspektasi kondisional E(Y i |Xi) dapat juga diartikan
sebagai Pr (Yi=1 |Xi) yaitu probabilitas bahwa seseorang pernah melakukan
perjalanan ke luar negeri. Dengan dasar inilah model tersebut disebut Model
Probabilitas Linier.
Secara matematis, berdasarkan pada model (7.2), dan dengan
mengasumsikan bahwa E(  ) = 0, maka:
E(Yi |Xi) =  0  1 X i (7.3)
persamaan (7.3) dapat dikatakan bahwa ekspektasi kondisional E (Y. 1 X,)
dapat dilihat sebagai probabilitas kondisional P(Yi = 1 | Xi) dan sebagai
konsekuensinya, P(Yi |Xi) =  0  1 X i . Ini berarti bahwa  0  1 X i harus
memenuhi persyaratan probabilitas yaitu nilainya terletak antara 0 dan 1.
Padahal berdasarkan hasil estimasi regresi, besaran  0  1 X i bisa bernilai
berapa saja tergantung pada nilai-nilai  0 , 1 dan Xi. Oleh karena itu, model
ini perlu ditangani secara khusus.
Lebih spesifik lagi, bila p i menyatakan probabilitas bahwa individu i
pernah melakukan perjalanan ke luar negeri, yaitu bila Y i = 1; sementara (1 -
p) menyatakan probabilitas bahwa individu i tidak pernah melakukan
perjalanan ke luar negeri, yaitu bila Y, = 0, maka variabel Y, mempunyai
distribusi sebagai berikut: P (Y i = 1) = pi dan P(Yi = 0) = (1 – pi ). Oleh karena
itu, berdasarkan teori ekspektasi, didapat:
E(Yi |Xi) = (Yi = 1).P(Yi = 1|Xi) + (Yi = 0).P(Yi = 0|Xi)
= P(Yi = 1 | Xi) = pi (7.4)
Sehingga, dengan membandingkan persamaan (7.3) dan (7.4) diperoleh:
E(Yi |Xi) =  0  1 X i = pi (7.5)
Sebagai konsekuensinya, karena pi adalah suatu probabilitas, maka 0  pi  1
dan akibatnya: 0   0  1 X i  1 (7.6)
Dengan demikian, akan ada masalah besar bila model tersebut diestimasi
dengan OLS. Apakah estimator hasil dari OLS dapat menjamin bahwa
besaran  0  1 X i terletak antara 0 dan 1? Disamping itu, apakah estimator
hasil OLS masih mempunyai sifat BLUE?

Estimasi Model dengan OLS


Bila model (7.1) diestimasi dengan menggunakan Ordinary Least
Square (OLS), dapat dihasilkan suatu estimator. Akan tetapi, ada
masalah-masalah yang perlu diperhatikan; yaitu:
1.  tidak berdistribusi normal
 i  Yi   0  1 X i (7.7)
Pada saat Yi = 1;  i  1   0  1 X i
Pada saat Yi = 0;  i    0  1 X i
Dengan demikian,  i tidak dapat diasumsikan mengikuti distribusi
normal. Bahkan jelas bahwa  i mengikuti distribusi Binomial. Apakah
keadaan ini merupakan suatu masalah yang besar? Ternyata, hal ini
bukan merupakan masalah yang besar bila sampel yang dianalisis cukup
besar.
Berdasarkan kaidah statistik, untuk sampel yang besar,  i dapat

diasumsikan mengikuti distribusi normal. Selain itu, OLS tidak


mensyaratkan bahwa  i harus mengikuti distribusi normal. Hanya saja
bila kita menginginkan interval kepercayaan dan lain-lain, persyaratan
normalitas baru diperlukan.
2. Variansi  i heteroskedastis
Meskipun diasumsikan bahwa E(  i ) = 0 dan E(  i ,  j ) = 0 untuk i  j,
 i masih tidak mempunyai variansi yang homoscedastic. Perhatikan

bahwa  i mengikuti distribusi probabilitas sebagai berikut:


i Probabilitas
  0  1 X i 1 – pi
1   0  1 X i pi

Berdasarkan definisi
var (  i ) = E [  i - E(  i )]2
= E (  i ) ; karena berdasarkan asumsi: E (  i )=0
2

Oleh karena itu, dengan menggunakan distribusi probabilitas dari  i ,


diperoleh:
var (  i ) = E (  i ) = (   0  1 X i )2(1- pi) + (1   0  1 X i )2(pi)
2

= (   0  1 X i )(1   0  1 X i ) (7.8)
atau
var (  i ) = E(Yi |Xi)(1- E(Yi |Xi)) (7.9)
= pi(1- pi)
Jadi, var (  i ) tergantung pada probabilitas pi yang berbeda-beda pada
setiap individu i. Dengan demikian var (  i ) heteroskedastis. Akibatnya,
bila model (7.1) diestimasi menggunakan OLS, estimatornya masih
unbiased tetapi tidak efisien karena variansinya besar. Akan tetapi,
masalah heteroskedastisitas ini dapat diatasi dengan
mentransformasikan model aslinya dengan w i = pi(1- pi) sehingga
modelnya menjadi berikut:
Yi  X 
 0  2 i  i (7.10)
wi wi wi wi

atau

Yi*   0*  1 X i*   i* (7.11)

Secara eksplisit, akibat transformasi tersebut adalah E (  i *) = 0, dan Var (  i


2
) = 1 (konstan).
Model (7.11) akan mempunyai variansi (  i ) yang homoskedastis. Sehingga
model (7.11) dapat diestimasi dengan OLS dan estimatornya akan BLUE
(Best Linear Unbiased Estimator).
Masalahnya adalah bagaimana cara mendapatkan w i, padahal pi tidak
diketahui.
Hal ini dapat dilakukan sebagai berikut:
i. Lakukan estimasi model Yi   0  1 X i   i dengan OLS dan hitung Yˆi ,

estimasi dari E(Yi|Xi) = pi, kemudian hitung: wi= Yˆi (1- Yˆi ).
ii. Gunakan wi untuk mendapatkan model yang sudah diransformasikan:
Yi  X 
 0  2 i  i
wi wi wi wi

atau
Yi*   0*  1 X i*   i* (7.12)
Lakukan estimasi model (7.12) dengan OLS.

3. Persyaratan 0  E (Yi | X i )  1 sulit untuk dipenuhi


Pertama-tama yang perlu dipertanyakan, mengapa persyaratan tersebut
harus dipenuhi?
Dalam bagian terdahulu telah diketahui bahwa E(Y i |Xi) = pi dan pi adalah
probabilitas bahwa suatu kejadian terjadi pada individu i. Karena pi
adalah suatu probabilitas, maka pi harus terletak di antara 0 dan 1.
Demikian pula E(Yi |Xi), karena E(Yi |Xi) = pi. Bagaimana cara mengatasi
agar E(Yi | X) terletak antara 0 dan 1?

Ada dua cara untuk mengatasi hal tersebut:


a) Tentukan estimasi model Y  β 0  β1 Xi  ε i (7.12) dengan OLS. Bila
* * * *
i

E(Yi |X) terletak antara 0 dan 1 berarti tidak ada masalah. Sebaliknya,
jika ada nilai E(Yi |X) yang terletak di luar 0 dan 1 maka dapat
didefinisikan sebagai berikut: bila E(Y i |X) > 1, dianggap E(Yi |X) = 1
dan bila E(Yi |X) < 0, dianggap E(Yi |X) = 0. Dengan demikian, setelah
disesuaikan, E(Yi |X) akhirnya akan terletak antara 0 dan 1. Namun,
metode ini tidak populer karena kurang realistis.
b) Tentukan estimasi model Yi  β 0  β1 Xi  ε i dengan suatu metode yang
akan menjamin bahwa E(Yi|X) terletak antara 0 dan 1. Ada dua
macam teknik yang dapat digunakan, yaitu: (i). Logit (ii). Probit. Kedua
teknik ini akan dibicarakan secara tersendiri.

4. Bagaimana dengan R2
R2 pada model probabilitas linier perlu dipertanyakan, karena R 2 tidak
dapat dijadikan ukuran yang baik atau Goodness of Fit.

Contoh
Misalnya akan dilihat hubungan antara pernah-tidaknya melakukan
perjalanan ke luar negeri, dan penghasilan per bulan. Berdasarkan data
hipotesis yang terlihat pada Tabel 7.1 akan dibentuk model sebagai berikut.
Yi  β 0  β1 Xi  ε i

dengan:
Yi = pernah-tidaknya melakukan perjalanan ke luar negeri
Xi = Pendapatan

Tabel 7.1. Seseorang yang Pernah Melakukan Perialanan ke Luar Negeri


dan Penghasilan per Bulan
Keluarga Pernah Pendapatan Keluarga Pernah Pendapatan
Melakukan (Juta Rp.) Melakukan (Juta Rp.)
Perjalanan ke Perjalanan ke
Luar Negeri Luar Negeri
01 0 2,8 21 1 4,3
02 1 3.4 22 1 5,6
03 1 5,3 23 0 1,4
04 0 2,1 24 0 0,9
05 0 1,9 25 1 7,3
06 1 3,6 26 0 1,3
07 1 3,7 27 1 6,3
08 0 1,7 28 1 3,7
09 0 1,2 29 0 1,9
10 0 1,5 30 0 2,0
11 1 1,9 31 1 4,2
12 1 2,0 32 0 3,2
13 0 2,1 33 1 4,0
14 1 2,9 34 1 3,0
15 0 1,1 35 0 1,0
16 1 1,8 36 0 0,9
17 1 7,0 37 1 2,4
18 0 2,2 38 1 2,3
19 0 2,0 39 0 1,7
20 1 6,0 40 1 5,0

Berdasarkan data yang tersaji, diperoleh taksiran model yang ditaksir dengan
OLS sebagai berikut:
Yi = -0,0637 + 0,1986 Xi (7.13)

R2 = 0,4665
Interpretasi Model
a) Intercept = -0,0637; artinya bila pendapatan seseorang Rp 0, maka
probabilitas bahwa orang tersebut pernah melakukan perjalanan ke luar
negeri adalah negatif. Pernyataan tersebut tentunya tidak benar, sehingga
perlu untuk diluruskan. Sebaiknya dinyatakan bahwa, seseorang yang
mempunyai pendapatan lebih kecil dari Rp 321.000, probabilitas orang
tersebut pernah melakukan perjalanan ke luar negeri masih nol. Baru
setelah pendapatan seseorang sekitar Rp 321.000 atau lebih probabilitas
seseorang untuk pernah melakukan perjalanan ke luar negeri positif. Hal
ini dapat dihitung dari persamaan (7.13), yaitu: -0,0637 + (0,1986 * Rp
321.000) = 0,0000506. Tetapi, untuk seseorang dengan pendapatan lebih
besar dari Rp 5,4 juta, probabilitas pernah melakukan perjalanan ke luar
negeri lebih dari satu. Keadaan ini harus diartikan bahwa kemungkinan
seseorang dengan pendapatan lebih besar dari Rp. 5,4 juta pernah
melakukan perjalanan ke luar negeri adalah satu. Orang tersebut sudah
dapat dipastikan. mampu melakukan perjalanan ke luar negeri.

b) Slope = 0,1986, artinya bila pendapatan naik 1 unit (Rp I juta) probabilitas
seseorang untuk melakukan perjalanan keluar negeri naik 20%.
c) Kelemahan
1) Ada probabilitas yang negatif, yaitu pada saat pendapatan lebih kecil.
dari Rp. 321.000 dan ada probabilitas lebih besar dari 1, yaitu pada
saat pendapatan lebih besar dari Rp 5,4 juta.
2) Kenaikan probabilitas yang linier. Setiap ada kenaikan Rp 1 juta
pendapatan, probabilitas seseorang untuk melakukan perjalanan ke
luar negeri naik 20 %. Kenaikan ini tetap 20 % tanpa terpengaruh
tingkat pendapatan. Akibatnya, pada saat pendapatan lebih besar dari
Rp 5,4 juta, probabilitas sese orang untuk melakukan perjalanan ke
luar negeri lebih besar daripada 1. Probabilitas ini akan naik terus
setiap pendapatan naik.
Apa yang dijabarkan di atas tentunya merupakan permasalahan serius.
Oleh karena itu, perlu untuk diatasi. Salah satu langkah untuk
mengatasinya adalah dengan membuat interpretasi yang rasional.
Dalarn model ini, bila pendapatan melebihi nilai tertentu (sekitar Rp 5,4
juta), probabilitas seseorang untuk melakukan perjalanan ke luar
negeri dianggap sama dengan satu. Artinya, orang yang mempunyai
pendapatan Rp 5,4 juta atau lebih diasumsikan sudah pasti mampu
melakukan perjalanan ke luar negeri. Akan tetapi, mengatasi
permasalahan dengan cara demikian, sangat ticlak dianjurkan.
d) Permasalahan lain yang perlu diingat bahwa, model tersebut tidak
mempertimbangkan adanya heteroskedastisitas. Kalaupun masalah
heteroskedastisitas ini diatasi, masalah bahwa suatu probabilitas akan
terletak diluar 0 dan 1 masih akan mungkin terjadi. Akibatnya, masih akan
banyak kelemahan-kelemahan meskipun model tersebut dapat kita
estimasi dengan menggunakan Weighted Least Square (WLS) yaitu OLS
dengan mentransformasikan modelnya dengan suaftj weight agar
heteroskedastisitas hilang dari model.

Secara umum, karena banyaknya kelemahan-kelemahan Model Probabilitas


Linier (MPL), maka model ini jarang digunakan meskipun teknik
pemodelannya relatif mudah. Sebagai alternatifflya, akan diperkenalkan
pemodelan logit dan probit yang akan menjamin bahwa suatu probabilitas
akan terletak antara 0 dan 1.
7.1.5.3. MODEL LOGIT
Pada model probabilitas linier yang telah dibahas sebelumnya didefinisikan:
pi = E(Yi |Xi) = β 0  β1 X i (7.14)
Sekarang, perhatikan pendefinisian lain sebagai berikut.
1
pi = E(Yi |Xi) =  (β 0  β1 X i ) (7.15)
1 e
atau
1
pi = dengan Z = β 0  β1 X i . (7.16)
1  e Z
Pendefinisian pi dalam bentuk (7.15) ini mengikuti fungsi distribusi logistik.
Sehingga model ini dinamakan Model Logit.
Pengamatan-pengamatan dalam model ini.
a) 0 < pi <1, karena    Z   maka
bila Z   → pi→1
bila Z   → pi→0
b) pi mempunyai hubungan nonlinier dengan Z i, artinya pi tidak konstan
seperti pada model probabilitas linier.
c) Model Logit adalah model nonlinier baik dalam parameter maupun dalam
variabel, sehingga metode OLS tidak dapat digunakan.
Pendefinisian probabilitas terjadinya peristiwa dalam model logit ditulis
sebagai:
1 1 e Z
pi = dan 1- p i =1- =
1  e Z 1  e Z 1  e Z

1
pi  Zi 1
 1  eZ i   Z i  e  Z i  eβ 0  β 1 X i
1  pi e e
 Zi
1 e
Angka ini disebut Odd/resiko yaitu perbandingan antara probabilitas
terjadinya peristiwa dengan probabilitas tidak terjadinya peristiwa.
Makin besar odd makin besar kecenderungan seseorang melakukan
perjalanan ke luar negeri.
Bila odd ini diambil logarithmanya diperoleh:
pi
Li=ln  β 0  β1X i
1  pi

Sehingga model yang dianalisis menjadi:


pi
Li=ln  β 0  β1X i .
1  pi

7.1.5.4. LATIHAN
1. Diberikan data tentang pendapatan keluarga (X) dan status
kepemilikan rumah (y=1): rumah sendiri, (y=0): sewa. Tentukan
estimasi model regresi linier untuk data dibawah. Apakah masuk
akal?

Responden Pendapatan Status Kepemilikan


1 8,3 0
2 21,2 1
3 9,1 0
4 13,4 1
5 17,7 0
6 23 0
7 11,5 1
8 10,8 0
9 15,4 1
10 22,4 1
11 18,7 1
12 10,1 0
13 19,5 1
14 8 0
15 12 1
16 24 1
17 21,7 1
18 9,4 0
19 10,9 0
20 22,8 1

Section I.3 PENUTUP


7.1.6. Test Formatif
Suatu eksperimen telah dilakukan untuk menentukan hubungan antara
variabel gaji (Y), lama bekerja (X) dan jenis kelamin (G). Diperoleh delapan
pasang observasi sebagai berikut.
X 1 2 5 7 6 4 3 8
G 1 0 0 1 1 1 1 0
Y 500 800 1200 1400 1500 900 600 1800
Berdasarkan data tersebut, Model regresi yang diformulasikan adalah :
Y   0  1 X   2 G  

Y : gaji
X : lama bekerja
G = 1 ; untuk laki-laki
G = 0 ; untuk wanita

1)  0 sama dengan

A. 394,18 B. 390,118
C. 394,118 D. 394,8

2) 1 sama dengan

A. 171,510 B. 174,510
C. 174,50 D. 175,410

3)  2 sama dengan

A. 147,59 B. 147,059
C. -147,59 D. -147,059
4) s2 sama dengan
A.1843,373 B. 1841,373
C. 18431,373 D. 18431,73
5) R2 sama dengan
A. 0,938 B. 0,95
C. 0,948 D. 0,90
6) Statistik penguji F untuk uji hipotesis H0 : β1 = β2 = 0 sama dengan
A. 43,12916 B. 37,886
C. 34,21619 D. 37,346

7.1.7. Umpan Balik dan Tindak Lanjut


Bandingkan jawaban anda dengan Kunci jawaban test formatif 1 yang
ada di belakang modul ini. Hitunglah jumlah jawaban anda yang benar.
Kemudian gunakan rumus di bawah ini untuk mengetahui tingkat penguasaan
anda terhadap materi kegiatan belajar ini.
Rumus:
Jumlah jawaban anda yang benar
Tingkat penguasaan = x 100%
jumlah soal

Arti tingkat penguasaan yang anda capai:


90% - 100% = baik sekali
80% - 89% = baik
70% - 79% = cukup
60% - 69% = kurang
Kalau anda mencapai tingkat penguasaan 80% keatas anda dapat
meneruskan kegiatan belajar berikutnya. Tetapi bila tingkat penguasaan anda
masih dibawah 80% anda harus mengulangi kegiatan belajar ini, terutama
bagian yang belum anda kuasai.

7.1.8. Rangkuman
Dalam analisis regresi linier berganda dengan variabel bebas dummy
yang terlibat dalam model mempunyai kategori lebih dari dua (katakanlah k
kategori), maka variabel dummy yang dapat dibentuk adalah sebanyak (k-1).
Sebagai contoh, misalnya variabel “pendidikan” dikategorikan menjadi 3
kelompok: tidak tamat SMU, tamat SMU dann tamat PT, maka dibutuhkan 2
variabel dummy, yaitu:
D2 = 1, tamat SMU
= 0, lainnya
D3 = 1, tamat PT
= 0, lainnya
Sedangkan kelompok dengan pendidikan tidak tamat SMU disebut grup
dasar.

Jika model regresi dimana variabel responnya merupakan variabel


kategori maka dapat dilakukan analisis dengan menggunakan model logit.

Pada model probabilitas linier telah didefinisikan:


pi = E(Yi |Xi) = β 0  β1 X i
Perhatikan juga pendefinisian lain berikut:
Pendefinisian probabilitas terjadinya peristiwa dalam model logit ditulis
sebagai:
1 1 e Z
pi = dan 1- p i =1- = maka
1  e Z 1  e Z 1  e Z

1
pi  Zi 1
 1  eZ i   Z i  e  Z i  eβ 0  β 1 X i
1  pi e e
 Zi
1 e
Angka ini disebut Odd/resiko yaitu perbandingan antara probabilitas
terjadinya peristiwa dengan probabilitas tidak terjadinya peristiwa.
Bila odd ini diambil logarithmanya diperoleh:
pi
Li=ln  β 0  β1X i
1  pi

Sehingga model yang dianalisis menjadi:


pi
Li=ln  β 0  β1X i .
1  pi

7.1.9. Kunci Jawaban test formatif


1) C
2) B
3) D
4) C
5) A
6) B

DAFTAR PUSTAKA
1. Montgomery, D.C. and Peck, E, 1982, Introduction to Linier Regression
Analysis, John Wiley & Sons, Singapore.
2. Nachrowi Djalal & Hardius Usman, Penggunaan Teknik Ekonometri,
2002, PT Raja Grafindo Persada, Jakarta.

Anda mungkin juga menyukai