variabel penjelas atau variabel tergantung berupa data kategorikal (sering disebut data nominal). Misalnya laki-laki dan perempuan, desa-kota, industri pangan, sandang, dan peralatan.
Contoh kita ingin mengetahui jenis kelamin, lokasi, dan
industri terhadap upah, 1. Pengaruh jenis kelamin atas upah, modelnya,
Upah = a + b1DJK + e
Dimana DJK adalah Dummy jenis kelamin (laki-laki
dan wanita) 2. Pengaruh lokasi terhadap upah, apakah desa lebih rendah upahnya dari kota, modelnya,
Upah = a + b1DLOK + e
dimana DLOK adalah dummy lokasi
3. Pengaruh industri terhadap upah, modelnya
Upah = a + b1DIND + e
dimana DIND adalah dummy setiap klasifikasi industri
Untuk memudahkan lihat contoh data berikut: Industri Kode Industri Upah Pangan 31 500 Sandang 32 522 Sandang 32 530 Pangan 31 512 Peralatan logam 38 600 Peralatan logam 38 642 Pangan 31 540 Pangan 31 520 Sandang 32 580 Sandang 32 570
Cara Membuat Variabel Dummy
Untuk dapat membedakan pengaruh masing-masing
industri atas upah kita akan membuat variabel dummy. Caranya adalah memberi nilai 1 pada kategori tersebut dan memberi nol bagi kategori lainnya data berubah menjadi sebagai berikut.
Industri Kode Industri Upah Dpangan Dsandang Dalat
Sekarang perhatikan upah rata-rata untuk masing-masing
industri:
500 + 520 + 540 + 520
Pangan = = 520 4 520 + 530 + 580 + 570 Sandang = = 550 4 600 + 640 Peralatan= = 620 2 Jika kita memiliki 3 dummy variabel maka kita bisa memasukkan 2 variabel dummy, sedangkan yang satu akan berfungsi menjadi benchmark atau pematok. Besarnya benchmark tidak lain adalah intercept atau nilai a.
Contoh: Upah = a + b1 Dsandang + b2 Dalat + e
Dari data di atas hasilnya adalah sebagai berikut
Upah = 520 + 30 Dsandang + 100 Dalat
Jadi rata-rata upah industri pangan yang tidak dimasukkan ke dalam model menjadi intersep (benchmark) beda upah sandang terhadap pangan adalah nilai b1=30 dan beda upah rata-rata industri peralatan terhadap industri pangan adalan 100. Sebaliknya jika yang tidak dimasukkan dalam regresi adalah industri peralatan, maka hasil regresi akan berubah sebagai berikut,
Upah = 620 - 100 Dpangan - 70 Dsandang
Sekarang intersep (a) menjadi rerata industri alat, dan beda
upah pangan terhadap industri alat adalah minus 100 dan beda upah industri alat adalah minus 70.
Kesimpulannya jika kita punya n variabel dummy, maka kita
dapat memasukkan n-1 variabel dalam model regresi, dan yang menjadi intersep adalah nilai rata-rata variabel yang tidak dimasukkan.
Perhatikan cara memaknai parameter hasil regresi yang
menggunakan dummy di atas.
Sekarang kita akan memasukkan data pendidikan pada data
yang kita miliki di atas, data lengkapnya menjadi sebagai berikut. Industri Kode Industri Upah Dpangan Dsandang Dalat Pangan 31 500 1 0 6 Sandang 32 520 0 1 9 Sandang 32 530 0 1 9 Pangan 31 520 1 0 9 Peralatan logam 38 600 0 0 12 Peralatan logam 38 640 0 0 11 Pangan 31 540 1 0 9 Pangan 31 520 1 0 6 Sandang 32 580 0 1 12 Sandang 32 570 0 1 9
Hasil di atas dapat kita ringkas dan sajikan sebagai
berikut:
Upah = 448,4 - 18,62 Dsandang + 49,9 Dalat +
10,5 Pendidik (12,)** (-1,04) (2,287)** (2,486)**
R2 = 0,839 F = 0,4
Makna hasil regresi sekarang adalah sebagai berikut:
Pada tingkat pendidikan yang sama, maka upah
industri sandang adalah minus 18,6 di bawah industri pangan (industri yang tidak diikutkan dalam regresi). Upah industri peralatan pada tingkat pendidikan yang sama adalah 49,9 di atas industri pangan. Mengapa angkanya menjadi semakin kecil dari sebelumnya? Hal ini disebabkan adanya perbedaan pendidikan di ketiga industri, perbedaan upah tidak semata disebabkan oleh perbedaan industri tetapi juga disebabkan oleh perbedaan pendidikan. Ini dapat juga dikatakan bahwa pendidikan menjadi variabel KONTROL yan bertugas memurnikan pengaruh perbedaan industri atas upah.
LATIHAN
Sekarang buatlah analisis dengan data berikut.
INDUSTRI LABA KAPITAL
A 10 10 A 12 11 A 14 12 A 12 9 B 13 13 B 15 23 B 11 25 B 10 16 B 18 31 C 20 40 C 22 50 C 23 52 A 20 20 A 11 30 B 15 40
Buatlah model analisis yang menjawab pertanyaan penelitian
berikut: 1. Apakah ketiga industri memiliki laba benar-benar yang berbeda? Buatlah dummy variabelnya. 2. Apakah laba itu disebabkan oleh beda industri atau modal, berapa sumbangan masing-masing? 3. Mana variabel yang signifikan? 4. Tunjukkan ketepatan modelnya. 5. Ujilah asumsi klasiknya. 6. Sajikan hasil regresi secara internasional sebagaimana modul 6
Soal di atas hanya dapat dipecahkan melalui program paket