Anda di halaman 1dari 6

Jelaskan tentang Dummy Dependent Variable (DDV) dan Dummy Independent

Variable (DIV), sertai dengan ilustrasi contoh data dan prosedur pengolahan datanya?

1. Dummy Dependent Variable (DDV)


Dalam model variabel dependen dummy, variabel dependen (juga dikenal sebagai
respons, sisi kiri, atau variabel Y) bersifat kualitatif, bukan kuantitatif. Dalam statistik dan
ekonometrik , khususnya dalam analisis regresi , variabel dependen dummy adalah variabel
yang hanya menggunakan nilai 0 atau 1 untuk menunjukkan tidak adanya atau adanya
beberapa efek kategorikal yang mungkin diharapkan dapat menggeser hasil. Variabel ini
dapat dianggap sebagai pengganti numerik untuk fakta kualitatif dalam model regresi ,
menyortir data ke dalam kategori yang saling eksklusif. Variabel dependen dummy sering
digunakan dalam analisis deret waktu dengan peralihan rezim, analisis musiman dan aplikasi
data kualitatif.
Model dengan variabel dependen tiruan (juga dikenal sebagai variabel dependen
kualitatif) adalah model di mana variabel dependen, sebagaimana dipengaruhi oleh variabel
penjelas, bersifat kualitatif. Beberapa keputusan mengenai 'seberapa banyak' suatu tindakan
harus dilakukan melibatkan pengambilan keputusan sebelumnya tentang apakah akan
melakukan tindakan tersebut atau tidak. Misalnya, jumlah output yang akan diproduksi, biaya
yang akan dikeluarkan, dll. Melibatkan keputusan sebelumnya tentang apakah akan
memproduksi atau tidak, apakah akan membelanjakan atau tidak, dll. "Keputusan
sebelumnya" seperti itu menjadi boneka yang bergantung dalam model regresi.
Misalnya, keputusan seorang pekerja untuk menjadi bagian dari angkatan kerja
menjadi variabel dependen tiruan. Keputusan bersifat dikotomis , yaitu keputusan memiliki
dua kemungkinan hasil: ya dan tidak. Jadi variabel dummy dependen Partisipasi akan
mengambil nilai 1 jika berpartisipasi, 0 jika tidak berpartisipasi. Beberapa contoh lain dari
boneka dependen dikotomis dikutip di bawah ini:
Keputusan: Pilihan Pekerjaan. Dependent Dummy: Supervisory = 1 jika supervisor, 0 jika
bukan supervisor.
Keputusan: Berafiliasi dengan Partai Politik. Dependent Dummy: Affiliation = 1 jika
berafiliasi dengan party, 0 jika tidak berafiliasi.
Keputusan: Pensiun. Dependent Dummy: Retired = 1 jika pensiun, 0 jika tidak pensiun.
Ketika variabel dummy dependen kualitatif memiliki lebih dari dua nilai (seperti
afiliasi ke banyak partai politik), itu menjadi model multirespons atau multinomial atau
polikotomus.
Model variabel dummy dependen
Analisis model variabel dummy dependen dapat dilakukan melalui metode yang
berbeda. Salah satu metode tersebut adalah metode OLS biasa, yang dalam konteks ini
disebut model probabilitas linier. Metode alternatif adalah dengan mengasumsikan bahwa
terdapat variabel laten kontinu yang tidak dapat diamati Y * dan variabel dikotomis yang
diamati Y = 1 jika Y * > 0, 0 sebaliknya. Ini adalah konsep yang mendasari model logit dan
probit . Model-model ini dibahas secara singkat di bawah ini.
Model probabilitas linier
Model kuadrat terkecil biasa di mana variabel dependen Y adalah boneka dikotomis, dengan
mengambil nilai 0 dan 1, adalah model probabilitas linier (LPM).Misalkan kita
mempertimbangkan regresi berikut:

dimana :
X = pendapatan keluarga
Y= 1  Jika rumah milik keluarga, 0 jika rumah bukan milik keluarga
Model tersebut dinamakan model probabilitas linier karena regresi bersifat linier.
Rata-rata bersyarat dari Yi diberikan Xi, ditulis sebagai E(YiIXi), diinterpretasikan sebagai
proobabilitas bersyarat bahwa peristiwa tersebut akan terjadi untuk nilai Xi-yaitu. Pr
(Yi=1IXi) memberikan probabilitas sebuah rumah dimiliki oleh keluarga yang
penghasilannya diberika oleh Xi. Sekarang, menggunkaan asumsi OLS E (uIXi)=0, kita
mendapatkan

Beberapa masalah melekat pada model LPM:


1. Garis regresi tidak akan menjadi baik dipasang satu dan karenanya langkah-langkah
penting, seperti R 2 , tidak akan dapat diandalkan.
2. Model yang dianalisis dengan pendekatan LPM akan
mengalami gangguan heteroskedastis .
3. Istilah kesalahan akan memiliki distribusi tidak normal.
4. LPM dapat memberikan nilai prediksi dari variabel dependen yang lebih besar dari 1
atau kurang dari 0. Ini akan sulit untuk ditafsirkan karena nilai prediksi dimaksudkan
sebagai probabilitas, yang harus berada di antara 0 dan 1.
5. Mungkin terdapat hubungan non-linier antara variabel model LPM, dalam hal ini, regresi
linier tidak akan cocok dengan data secara akurat. 
Alternatif untuk LPM

Gambar 1: Fungsi distribusi kumulatif.


Untuk menghindari keterbatasan LPM, yang dibutuhkan adalah model yang memiliki
keistimewaan yang seiring dengan bertambahnya variabel penjelas, X i , P i = E ( Y  i = 1
| X i ) harus tetap berada dalam range antara 0 dan 1. Dengan demikian, hubungan antara
variabel independen dan dependen bersifat non-linier.
Untuk tujuan ini, fungsi distribusi kumulatif (CDF) dapat digunakan untuk
memperkirakan regresi variabel dummy dependen. Gambar 4 menunjukkan kurva berbentuk
'S', yang menyerupai CDF dari variabel acak. Dalam model ini, probabilitasnya antara 0 dan
1 dan non-linearitas telah ditangkap. Pilihan CDF yang akan digunakan sekarang menjadi
pertanyaan.
Dua CDF alternatif dapat digunakan: CDF logistik dan CDF normal . CDF logistik
memunculkan model logit dan CDF normal memunculkan model probit.
Model Logit
Kekurangan LPM mengarah pada pengembangan model yang lebih halus dan lebih
baik yang disebut model logit. Dalam model logit, distribusi kumulatif dari istilah kesalahan
dalam persamaan regresi adalah logistik.  Regresi ini lebih realistis karena bersifat non-linier.
Model logit diperkirakan menggunakan pendekatan kemungkinan maksimum . Dalam
model ini, P(Y=1IX), yang merupakan probabilitas variabel dependen mengambil nilai 1
mengingat variabel independen adalah:
Model tersebut kemudian diekspresikan dalam bentuk rasio peluang : apa yang dimodelkan
dalam regresi logistik adalah logaritma natural dari peluang, peluang didefinisikan sebagai P/
(1-P). Mengambil log natural dari peluang, logit ( L i ) dinyatakan sebagai

Hubungan ini menunjukkan bahwa Li linear terhadap Xi, tetapi probabilitasnya tidak linier
dalam hal Xi.
Model Probit
Model lain yang dikembangkan untuk mengimbangi kelemahan LPM adalah model
probit. Model probit menggunakan pendekatan non-linearitas yang sama seperti model
logit; namun, ia menggunakan CDF normal, bukan CDF logistik.

2. Dummy Independent Variable (DIV)


Variabel independen dummy (disebut juga variabel penjelas dummy) yang untuk
beberapa pengamatan memiliki nilai 0 akan menyebabkan koefisien variabel tersebut tidak
memiliki peran dalam mempengaruhi variabel dependen. Ketika dummy mengambil nilai 1
maka koefisiennya berperan untuk merubah yang mencegat. Misalnya, keanggotaan dalam
kelompok adalah salah satu variabel kualitatif yang relevan dengan regresi. Jika keanggotaan
grup secara sewenang-wenang diberi nilai 1, maka semua yang lain akan mendapatkan nilai
0. Kemudian intersep akan menjadi istilah konstan untuk non-anggota tetapi akan menjadi
istilah konstan ditambah koefisien boneka keanggotaan dalam kasus grup anggota
Memasukkan dummy independen
Gambar 2: Grafik yang menunjukkan upah = α 0 + δ 0 perempuan + α 1 pendidikan + U ,
δ 0  <0.
Variabel dummy independen digabungkan dengan cara yang sama seperti variabel kuantitatif
dimasukkan (sebagai variabel penjelas) dalam model regresi. Misalnya, jika kita
mempertimbangkan model regresi penentuan upah tipe Mincer , di mana upah bergantung
pada jenis kelamin (kualitatif) dan tahun pendidikan (kuantitatif).

dimana u~ N(0,o2) adalah istilah kesalahan . Dalam model, perempuan = 1 bila orang
tersebut perempuan dan perempuan = 0 bila orang tersebut laki-laki. dapat diartikan sebagai
perbedaan upah antara perempuan dan laki-laki, memegang pendidikan konstan. Jadi, δ 0
membantu untuk menentukan apakah ada diskriminasi upah antara laki-laki dan perempuan.
Misalnya, jika δ 0 > 0 (koefisien positif), maka perempuan memperoleh upah lebih tinggi
daripada laki-laki (menjaga faktor-faktor lain tetap konstan). Koefisien yang dilampirkan
pada variabel dummy disebut koefisien intersep diferensial . Model tersebut dapat
digambarkan secara grafis sebagai pergeseran intersep antara perempuan dan laki-laki. Dalam
gambar, kasus δ 0 <0 ditampilkan (di mana laki-laki mendapatkan upah lebih tinggi daripada
perempuan).
Variabel tiruan dapat diperluas ke kasus yang lebih kompleks. Misalnya, efek
musiman dapat ditangkap dengan membuat variabel tiruan untuk setiap musim : D1 = 1 Jika
observasi untuk musim panas, dan sebaliknya sama dengan nol; D2 = 1 jika dan hanya jika
musim gugur, jika tidak sama dengan nol; D3 = 1 jika dan hanya jika musim dingin, jika
tidak sama dengan nol; dan D 4 = 1 jika dan hanya jika pegas, jika tidak sama dengan nol.
Dalam data panel , boneka penaksir efek tetap dibuat untuk masing-masing unit dalam data
penampang (misalnya perusahaan atau negara) atau periode dalam rangkaian waktu yang
dikumpulkan. Namun, dalam regresi seperti itu baik suku konstan harus dihilangkan atau
salah satu boneka harus dihilangkan, dengan kategori yang terkait menjadi kategori dasar
yang digunakan untuk menilai variabel lain untuk menghindari perangkap variabel dummy.
Konstanta dalam semua persamaan regresi adalah koefisien yang dikalikan dengan
regressor yang sama dengan satu. Ketika regresi dinyatakan sebagai persamaan matriks,
matriks regresi kemudian terdiri dari kolom satu (suku konstanta), vektor nol dan satu
(dummies), dan kemungkinan regresi lainnya. Jika seseorang menyertakan boneka laki-laki
dan perempuan, katakanlah, jumlah vektor ini adalah vektor satu, karena setiap pengamatan
dikategorikan sebagai laki-laki atau perempuan. Jadi, jumlah ini sama dengan regressor suku
konstanta, vektor pertama satu. Akibatnya, persamaan regresi tidak akan terpecahkan, bahkan
dengan metode pseudoinverse yang khas. Dengan kata lain: jika ada regresi vektor-satu (suku
konstan) dan kumpulan boneka lengkap, terjadi multikolinearitas sempurna, dan sistem
persamaan yang dibentuk oleh regresi tidak memiliki solusi yang unik. Ini disebut sebagai
perangkap variabel dummy . Jebakan dapat dihindari dengan menghilangkan suku konstanta
atau salah satu boneka yang melanggar. Dummy yang dihapus kemudian menjadi kategori
dasar yang dibandingkan dengan kategori lainnya.

Anda mungkin juga menyukai