Anda di halaman 1dari 7

MODUL 12

VARIABEL DUMMY

Ada kalanya kita melakukan suatu regresi dimana


variabel penjelas atau variabel tergantung berupa data
kategorikal (sering disebut data nominal). Misalnya laki-laki
dan perempuan, desa-kota, industri pangan, sandang, dan
peralatan.

Contoh kita ingin mengetahui jenis kelamin, lokasi, dan


industri terhadap upah,
1. Pengaruh jenis kelamin atas upah, modelnya,

Upah = a + b1DJK + e

Dimana DJK adalah Dummy jenis kelamin (laki-laki


dan wanita)
2. Pengaruh lokasi terhadap upah, apakah desa lebih
rendah upahnya dari kota, modelnya,

Upah = a + b1DLOK + e

dimana DLOK adalah dummy lokasi


3. Pengaruh industri terhadap upah, modelnya

Upah = a + b1DIND + e

dimana DIND adalah dummy setiap klasifikasi industri


Untuk memudahkan lihat contoh data berikut:
Industri Kode Industri Upah
Pangan 31 500
Sandang 32 522
Sandang 32 530
Pangan 31 512
Peralatan logam 38 600
Peralatan logam 38 642
Pangan 31 540
Pangan 31 520
Sandang 32 580
Sandang 32 570

Cara Membuat Variabel Dummy

Untuk dapat membedakan pengaruh masing-masing


industri atas upah kita akan membuat variabel dummy.
Caranya adalah memberi nilai 1 pada kategori tersebut dan
memberi nol bagi kategori lainnya data berubah menjadi
sebagai berikut.

Industri Kode Industri Upah Dpangan Dsandang Dalat


Pangan 31 500 1 0 0
Sandang 32 520 0 1 0
Sandang 32 530 0 1 0
Pangan 31 520 1 0 0
Peralatan logam 38 600 0 0 1
Peralatan logam 38 640 0 0 1
Pangan 31 540 1 0 0
Pangan 31 520 1 0 0
Sandang 32 580 0 1 0
Sandang 32 570 0 1 0

Sekarang perhatikan upah rata-rata untuk masing-masing


industri:

500 + 520 + 540 + 520


Pangan = = 520
4
520 + 530 + 580 + 570
Sandang = = 550
4
600 + 640
Peralatan= = 620
2
Jika kita memiliki 3 dummy variabel maka kita bisa
memasukkan 2 variabel dummy, sedangkan yang satu akan
berfungsi menjadi benchmark atau pematok. Besarnya
benchmark tidak lain adalah intercept atau nilai a.

Contoh:
Upah = a + b1 Dsandang + b2 Dalat + e

Dari data di atas hasilnya adalah sebagai berikut

Upah = 520 + 30 Dsandang + 100 Dalat


Jadi rata-rata upah industri pangan yang tidak dimasukkan
ke dalam model menjadi intersep (benchmark) beda upah
sandang terhadap pangan adalah nilai b1=30 dan beda upah
rata-rata industri peralatan terhadap industri pangan adalan
100.
Sebaliknya jika yang tidak dimasukkan dalam regresi adalah
industri peralatan, maka hasil regresi akan berubah sebagai
berikut,

Upah = 620 - 100 Dpangan - 70 Dsandang

Sekarang intersep (a) menjadi rerata industri alat, dan beda


upah pangan terhadap industri alat adalah minus 100 dan
beda upah industri alat adalah minus 70.

Kesimpulannya jika kita punya n variabel dummy, maka kita


dapat memasukkan n-1 variabel dalam model regresi, dan
yang menjadi intersep adalah nilai rata-rata variabel yang
tidak dimasukkan.

Perhatikan cara memaknai parameter hasil regresi yang


menggunakan dummy di atas.

Sekarang kita akan memasukkan data pendidikan pada data


yang kita miliki di atas, data lengkapnya menjadi sebagai
berikut.
Industri Kode Industri Upah Dpangan Dsandang Dalat
Pangan 31 500 1 0 6
Sandang 32 520 0 1 9
Sandang 32 530 0 1 9
Pangan 31 520 1 0 9
Peralatan logam 38 600 0 0 12
Peralatan logam 38 640 0 0 11
Pangan 31 540 1 0 9
Pangan 31 520 1 0 6
Sandang 32 580 0 1 12
Sandang 32 570 0 1 9

Hasil di atas dapat kita ringkas dan sajikan sebagai


berikut:

Upah = 448,4 - 18,62 Dsandang + 49,9 Dalat +


10,5 Pendidik
(12,)** (-1,04) (2,287)** (2,486)**

R2 = 0,839
F = 0,4

Makna hasil regresi sekarang adalah sebagai berikut:

Pada tingkat pendidikan yang sama, maka upah


industri sandang adalah minus 18,6 di bawah industri pangan
(industri yang tidak diikutkan dalam regresi). Upah industri
peralatan pada tingkat pendidikan yang sama adalah 49,9 di
atas industri pangan. Mengapa angkanya menjadi semakin
kecil dari sebelumnya?
Hal ini disebabkan adanya perbedaan pendidikan di ketiga
industri, perbedaan upah tidak semata disebabkan oleh
perbedaan industri tetapi juga disebabkan oleh perbedaan
pendidikan. Ini dapat juga dikatakan bahwa pendidikan
menjadi variabel KONTROL yan bertugas memurnikan
pengaruh perbedaan industri atas upah.

LATIHAN

Sekarang buatlah analisis dengan data berikut.

INDUSTRI LABA KAPITAL


A 10 10
A 12 11
A 14 12
A 12 9
B 13 13
B 15 23
B 11 25
B 10 16
B 18 31
C 20 40
C 22 50
C 23 52
A 20 20
A 11 30
B 15 40

Buatlah model analisis yang menjawab pertanyaan penelitian


berikut:
1. Apakah ketiga industri memiliki laba benar-benar yang
berbeda? Buatlah dummy variabelnya.
2. Apakah laba itu disebabkan oleh beda industri atau
modal, berapa sumbangan masing-masing?
3. Mana variabel yang signifikan?
4. Tunjukkan ketepatan modelnya.
5. Ujilah asumsi klasiknya.
6. Sajikan hasil regresi secara internasional
sebagaimana modul 6

Soal di atas hanya dapat dipecahkan melalui program paket


karena variabelnya menjadi banyak. Gunakan SPSS

Anda mungkin juga menyukai