Data Dummy

Mengenal Dummy Dalam Regresi
Posted on July 6, 2017 by Agung

Variabel dummy dalam regresi sedikit berbeda dengan variabel lainnya baik dalam
pengolahan data ataupun saat membaca hasil regresi. Regresi linear atau regresi berganda
merupakan suatu fungsi yang menjelaskan hubungan varaibel independen dengan
variabel dependen. Satu variabel dependen (Y) biasanya dipengaruhi oleh beberapa
varaibel independen (X). misalnya variabel produksi dipengaruhi oleh luas lahan, pupuk,
jumlah tenaga kerja, modal.
Regresi memiliki beberapa persyaratan yang harus dipenuhi. Karena regresi masuk dalam
statistik parametrik, tentunya variabel-variabel didalamnya memiliki skala interval atau
rasio. Selain itu data-data yang akan digunakan juga harus memenuhi kaidah asumsi
klasik. Tetapi, dari beberapa variable yang kita gunakan, bisa saja satu atau dua variabel
tersebut berupa variabel dalam skala nominal atau ordinal. Variabel skala nominal atau
ordinal di dalam regresi tersebut biasa dikenal sebagai variabel dummy.
Agar lebih gampang dipahami, saya berikan contoh variabel dummy dalam regresi.
Misalkan saja kita ingin mengetahui pengaruh jenis kelamin terhadap pendapatan yang
dibelanjakan ke mall. Kita buat variabel jenis kelamin dengan nilai 0 untuk laki-laki dan
1 untuk perempuan. Contoh lain, pengaruh keikutsertaan petani dalam keanggotaan
kelompok tani terhadap pendapatan. Kita buat variabel keikutsertaan kelompok tani
dengan nilai 0 untuk petani yang tidak menjadi anggota, dan 1 untuk petani yang menjadi
anggota kelompok tani.
Variabel dummy dalam regresi berbeda dengan regresi logistik. variabel skala nominal di
regresi logistik terletak di variabel dependen atau nilai Y. sedangkan dummy yang
dimaksud disini adalah variabel skala nominal atau ordinal pada variabel independen
(nilai X). bisakah dummy di dalam regresi logistik? jawabannya tentu saja bisa.
Pemberian nilai 0 dan 1 juga memiliki tehnik tersendiri. Agar mudah dalam
menginterpretasikan hasil output regresi, sebaiknya nilai 1 diberikan kepada responden
yang diharapkan memiliki pengaruh terhadap nilai Y. Misalnya contoh keanggotaan
petani diatas, saya memiliki hipotesis bahwa keanggotaan ini memilikipengaruh terhadap
pendapatan petani. Sehingga saya memberikan nilai 1 terhadap petani yang menjadi
anggota kelompok tani. Karena nanti hasil koefisien pada variabel ini merupakan
pembeda antara petani yang tidak menjadi anggota dan petani yang menjadi anggota
kelompok tani. Jika anda memberi nilainya terbalik, sebenarnya tidak ada yang salah,
namun besar kemungkinan nilai koefisien yang keluar nantinya bernilai negatif. Tidak
ada yang salah dengan hasil perhitungan tersebut, hanya saja anda perlu mengerti cara
menjelaskan nilai negatif tersebut.
Saya akan langsung praktekkan penggunaan variabel dummy dalam regresi di aplikasi
minitab.
1
Saya memiliki data latihan yang bisa diunduh disini. Data tersebut merupakan data
rekayasa yang secara random saya peroleh melalui excell. Terdapat 5 variabel
independen, dimana salah satunya yakni variabel X2 merupakan variabel dummy dalam
regresi.
Mari kita buka minitabnya. Saya menggunakan minitab 17.
Kita masukkan datanya di sheet minitab
2
Kemudian klik stat – regression – regression – fit regression model
3
Responses kita masukkan variabel Y, continous preditors kita masukkan X1, X3, X4, X5.
Sedangkan variabel X2 yang merupakan variabel dummy dalam regresi kita masukkan ke
categorical predictors
4
Klik Ok dan tunggu hasilnya..
5
Terlihat dari model summary, nilai R-sq pada model memiliki nilai 65.09% artinya
bahwa 65% data yang diolah mampu dijelaskan oleh model hasil minitab tersebut. Bisa
dikatakan bahwa model ini cukup untuk merepresentasikan data yang ada.
6
Dilihat dari nilai p value, diantara kelima variabel hanya X2 yang memiliki nilai dibawah
0.05. artinya hanya x2 yang signifikan mempengaruhi nilai Y. dilihat dari nilai VIF,
variabel X1 dan variabel X4 memiliki nilai diatas 10, artinya kedua variabel tersebut
memiliki masalah multikolinear (sudah saya bahas di uji asumsi klasik).
Asumsi saya bahwa output diatas sudah dibenahi sesuai uji asumsi klasik, saya akan
menjelaskan output variabel dummy sesuai tema artikel kali ini.
Pada kolom koeffisien nilai 1 pada variabel X2 memiliki nilai 3876. Artinya bahwa
responden yang memiliki nilai 1 secara signifikan memiliki 3876 Y yang lebih tinggi
daripada responden yang bernilai 0. Hal ini juga bisa diperoleh dari regression equation
pada bagian paling bawah, yakni sbb:
Nilai model regresi saat X2 bernilai 0 adalah : 5468 + 2.89X1 – 19.0X3 – 5.74X4 –
1.49X5. sedangkan model regressi saat X2 bernilai 1 adalah : 9344 + 2.89X1 – 19.0X3 –
5.74X4 – 1.49X5. nilai koefisien 3876 diperoleh dari selisih kedua model tersebut dengan
asumsi X1, X3 X4 dan X5 memiliki nilai yang sama.
Baca Juga Cara Mengeliminasi Data Responden untuk Mendapatkan Model

Regresi yang Lebih Baik
Sehingga dapat disimpulkan variabel X2 yang bernilai 1 memiliki nilai Y 3876 lebih
tinggi daripada variabel X2 yang bernilai 0.
Pahami perbedaan pembacaan koefisien regresi lainnya. Karena jika variabel tersebut
merupakan variabel continous atau skala interval dan rasio, maka koefisien variabel akan
dibaca setiap tambahan satu satuan variabel independen akan meningkatkan variabel
dependen sebesar nilai koefisien.
Beda minitab, beda pula SPSS. Saya juga berikan langkah di SPSS karena SPSS juga
banyak digunakan. Pada SPSS variabel skala nominal dan ordinal sudah dipisahkan sejak
pertama kali diinput, sedangkan prosesnya sama seperti anda melakukan regresi berganda
atau linear. SPSS akan mengenali variabel dummy tersebut setelah anda memberi
keterangan bahwa variabel tersebut berskala nominal.
7
Mari kita buka SPSS, kemudian copy data ke sheet spss
8
Pada tab variabel view, saya menandai keterangan pada X2 bahwa variabel tersebut
adalah variabel dummy atau berskala nominal. Erhatikan di tabel measure pada gambar
dibawah ini
9
Kemudian klik analyze – regression –linear. Kemudian masukkan Y pada kolom
dependen, dan semua variabel X ke dalam kolom independen dan klik OK
10
Hasilnya adalah sebagai berikut
,,
11
Hasil yang diperoleh sama dengan hasil yang dikeluarkan oleh minitab. Nilai koefisien
bisa anda lihat di tabel koefisien pada kolom B dengan nilai 3876. Namun, SPSS tidak
menyediakan model untuk kedua nilai pada X2 seperti yang dikeluarkan oleh minitab.
12
13

Data Dummy

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Data Dummy

Diunggah oleh

Hak Cipta:

Format Tersedia

Mengenal Dummy Dalam Regresi

Posted on July 6, 2017 by Agung

Kita masukkan datanya di sheet minitab

Baca Juga Cara Mengeliminasi Data Responden untuk Mendapatkan Model

Anda mungkin juga menyukai