Anda di halaman 1dari 67

ANALISIS REGRESI DENGAN VARIABEL DUMMY

(Pertemuan ke-13)

Dosen : Dr. Eka Dewi Anggraini


Konsep Dasar Analisis Regresi dengan
Variabel Dummy

o Dalam fenomena ekonomi, variabel terikat tidak hanya dipengaruhi


oleh variabel bebas yang bersifat kuantitatif saja, tetapi juga sering
dipengaruhi oleh variabel bebas yang bersifat kualitatif.
o Misalnya, besarnya konsumsi sebuah keluarga tidak hanya
dipengaruhi oleh pendapatan kepala keluarga, jumlah anggota
keluarga, tetapi juga dapat dipengaruhi oleh gaya hidup keluarga,
selera dan variabel kualitatif lainnya.
o Untuk melakukan analisis regresi di mana sebuah variabel terikat
dipengaruhi oleh variabel bebas yang bersifat kualitatif maka
digunakan analisis regresi variabel dummy.
o Variabel kuantitatif merupakan variabel yang dinyatakan dalam
bentuk pernyataan atau judgement. Variabel kualitatif biasanya
menunjukkan kehadiran (presence) atau ketidakhadiran (absence)
dari suatu atribut, seperti mutu produk baik atau jelek, jenis
kelamin laki-laki atau perempuan, tempat tinggal di desa atau di
kota, dan lain lain.
o Untuk mengkuantitasikan variabel ini dilakukan dengan
membangun variabel buatan (dummy variable) yang mengambil
nilai 0 dan 1 di mana nilai 1 menunjukkan kehadiran (presence)
variabel tersebut sedangkan 0 menunjukkan ketidakhadiran
(absence) variabel tersebut. Oleh karena itu variabel ini berskala
nominal.
Model Regresi Satu Variabel Dummy dengan
Dua Kategori
o Regresi satu variabel dummy dengan dua kategori
digunakan untuk menganalisis hubungan kausal satu
variabel bebas yang merupakan variabel dummy terhadap
satu variabel terikat, di mana variabel dummy tersebut
menggunakan dua kategori.
o Model regresi dengan satu variabel kualitatif tanpa
mengikutsertakan variabel kuantitatif lainnya adalah
serupa dengan analisis ragam (ANOVA model).
Model yang digunakan untuk melakukan analisis regresi
satu variabel dummy dengan dua kategori adalah sebagai
berikut:
Y=a+bD+ ε
Keterangan:
Y = Nilai yang diramalkan.
a = Konstansta/intercept.
b = Koefisien regresi/slope.
D = Variabel bebas yang merupakan variabel dummy
dengan dua kategori.
ε = Nilai residu.
Nilai a (konstanta) dan nilai b (koefisien regresi) dalam
persamaan di atas dapat ditentukan dengan rumus
sebagai berikut:
Contoh : Seorang peneliti melakukan penelitian
dengan tujuan untuk menganalisis pengaruh jenis
kelamin terhadap produktivitas pegawai. Untuk
keperluan tersebut diambil sampel secara acak
sebanyak 10 orang yang terdiri dari 5 karyawan dan 5
karyawati. Data yang diperoleh adalah sebagai berikut:
Tabel 11.1: Data Contoh Analisis Regresi Variabel Dummy

Jenis kelamin (D) Produktivitas (Y)


1 12
0 9
0 8
1 13
0 8
1 11
1 10
0 7
0 8
1 13
Pertanyaan Penelitian
1. Apakah terdapat pengaruh jenis kelamin terhadap
produktivitas pegawai?
2. Hipotesis :
H0 : tidak terdapat pengaruh jenis kelamin terhadap
produktivitas pegawai
Ha : terdapat pengaruh jenis kelamin terhadap
produktivitas pegawai
3. Kriteria pengujian :
a. H0 tidak dapat ditolak jika :
 -t tabel  t hitung  t tabel, atau
 Sig  alpha (α/2)
b. Ha diterima jika :
 t hitung  -t tabel atau t hitung > t tabel, atau
 Sig  alpha (α/2)
4. Analisis Data
a. Membuat persamaan regresi. Untuk menghitung persamaan regresi
satu variabel dummy dengan dua kategori secara manual perlu
dibuat lembar kerja berikut :
Berdasarkan lembar kerja tersebut dapat dihitung
koefisien determinasi sebagai berikut :

Koefisien determinasi memiliki kelemahan, yaitu bias


terhadap jumlah variabel bebas yang dimasukkan dalam
model regresi, di mana setiap penambahan satu variabel
bebas dan pengamatan dalam model akan meningkatkan
nilai R² meskipun variabel yang dimasukkan itu tidak
memiliki pengaruh yang signifikan terhadap variabel
tergantungnya.
Untuk mengurangi kelemahan tersebut maka
digunakan koefisien determinasi yang telah
disesuaikan, Adjusted R Square (R2adj). Koefisien
determinasi yang telah disesuaikan berarti bahwa
koefisien tersebut telah dikoreksi dengan
memasukkan unsur jumlah variabel dan ukuran
sampel yang digunakan. Dengan menggunakan
koefisien determinasi yang disesuaikan maka nilai
koefisien determinasi yang disesuaikan itu dapat
naik atau turun dengan adanya penambahan
variabel baru dalam model.
Formula untuk menghitung koefisien determinasi yang
disesuaikan adalah :

Keterangan :
R2 = koefisien determinasi
N = ukuran sampel
P = jumlah variabel bebas

Dengan demikian maka berdasarkan kasus di atas besarnya


koefisien determinasi yang disesuaikan dapat dihitung sebagai
berikut :
d. Menghitung Kesalahan Baku Estimasi (Standart Error
of the Estimate)
Kesalahan baku estimasi merupakan satuan yang
digunakan untuk mengukur tingkat penyimpangan antara
persamaan regresi dengan nilai nilnya. Formula yang
digunakan untuk mengukur kesalahan baku estimasi
adalah sebagai berikut.
o Semakin rendah nilai kesalahan baku estimasi itu,
semakin baik model persamaan regresi tersebut
untuk digunakan sebagai proyeksi. Sebaliknya,
semakin tinggi nilai kesalahan baku estimasi,
semakin jelek persamaan regresi itu untuk membuat
proyeksi.
e. Menghitung Kesalahan Baku Koefisien Regresi.
Digunakan untuk mengukur besamya penyimpangan
dari masing-masing koefisien regresi yang terbentuk.
Semakin rendah kesalahan baku koefisien regresi maka
semakin berperan variabel tersebut dalam model.
Sebaliknya, semakin tinggi kesalahan baku koefisien
regresi maka semakin tidak berperan variabel tersebut
dalam persamaan regresi. Kesalahan baku koefisien
regresi dapat diukur dengan formula sebagai berikut:
Berdasarkan lembar kerja di atas maka dapat dihitung
besarnya kesalahan baku koefisien regresinya, yaitu :

f. Menghitung Nilai F Hitung. Nilai F hitung


digunakan untuk menguji ketepatan model atau goodness
of fit, apakah model persamaan yang terbentuk masuk
dalam kriteria cocok (fit) atau tidak. Uji F ini juga sering
disebut sebagai uji simultan, yaitu untuk menguji apakah
variabel bebas yang digunakan dalam model mampu
menjelaskan perubahan nilai variabel tergantung atau
tidak.
Untuk menyimpulkan apakah model masuk dalam cocok
atau fit atau tidak, kita harus membandingkan nilai F
hitung dengan nilai F tabel dengan df(k-1),(n-k). Untuk
menghitung besarnya nilai F hitung digunakan formula
sebagai berikut:
Dengan menggunakan lembar kerja di atas maka besarnya
nilai F hitung dari persamaan regresi yang terbentuk dapat
dihitung sebagai berikut :

Dengan df:α, (k-1), (n-k) atau 0,05, (2-1), (10-2)


diperoleh besarnya nilai F tabel sebesar 5,320. karena
nilai F hitung (32,818) > nilai F tabel (5,320) maka
disimpulkan model persamaan regresi yang terbentuk
masuk kriteria cocok atau fit.
g. Menghitung nilai t hitung. Nilai t hitung
digunakan untuk menguji apakah variabel tersebut
berpengaruh terhadap variabel tergantung atau tidak.
• Suatu variabel akan memiliki pengaruh jika nilai t hitung
variabel tersebut lebih besar dibanding nilai t tabel. Dalam
tabel distribusi t terdapat istilah satu ujung dan dua ujung.
• Penggunaan tabel satu ujung atau dua ujung tergantung
hipotesis yang diajukan.
• Jika hipotesis yang diajukan sudah menunjukkan arah,
misalnya terdapat pengaruh positif, maka digunakan satu
ujung sebelah kanan.
• Akan tetapi jika belum menunjukkan arah, misalnya
terdapat pengaruh (tidak menunjukkan pengaruh positif
atau negatif), maka menggunakan dua ujung.
Jika menggunakan satu ujung maka df: α,n-k, tetapi jika
menggunakan dua ujung maka derajat bebasnya adalah df: α,n-k.
Untuk menghitung besarnya nilai t hitung digunakan rumus sebagai
berikut:
𝑏𝑗
𝑡=
𝑆𝑏𝑗
t = nilai t hitung
bj = koefisien regresi
Sbj = kesalahan baku koefisien regresi
Untuk melakukan analisis regresi variabel dummy
dengan menggunakan SPSS, dapat dilakukan dengan
langkah berikut :
1. Buka file regresi satu dummy dua kategori
2. Klik analyze, regression, linear
3. masukkan variabel jenis kelamin pada kotak dependen
4. masukkan variabel produktivitas pada kotak
independen
5. Abaikan pilihan yang lain, klik OK
Analisis Tabel Model Summary
R atau multiple R = 0,897
R atau Multiple R menunjukkan korelasi antara variabel bebas
dengan variabel tergantungnya sebesar 0,897. Dalam hal ini
karena regresi satu variabel dummy di mana variabel bebasnya
hanya satu maka dapat dikatakan bahwa korelasi antara jenis
kelamin dengan produktivitas adalah sebesar 0,897.

R square = 0,804
R Square atau koefisien determinasi sebesar 0,804 berarti
bahwa variasi produktivitas dapat dijelaskan oleh variasi jenis
kelamin sebesar 80,4 persen atau variabel jenis kelamin
memengaruhi produktivitas sebesar 80,4 persen. Koefisien
determinasi sebesar 0,804 merupakan kuadrat dari multiple R
(0,897 x 0,897 = 0,804).
Adjusted R Square = 0,780
Adjusted R Square merupakan koefisien determinasi
yang telah terkoreksi dengan jumlah variabel, dan
ukuran sampel sehingga dapat mengurangi unsur bias
jika terjadi penambahan variabel. Adjusted R Square
sebesar 0,780 berarti variasi produktivitasnya dapat
dijelaskan oleh variasi jenis kelamin sebesar 78,0 persen
atau variabel jenis kelamin memengaruhi produktivitas
sebesar 78,0 persen. Koefisien Ajusted R Square sebesar
78,0 diperoleh dari perhitungan berikut:
Std. Error of the EstimateRad =0,804
Standard Error of the Estimate menunjukkan penyimpangan
antara persamaan regresi dengan nilai dependent riilnya adalah
sebesar 1,04881 satuan variabel terikat. Semakin kecil nilai
standard error, semakin baik versamaan regresi tersebut sebagai
alat prediksi.

Analisis Tabel Anova


1. Sum of square regression = 36,100
Merupakan nilai yang menunjukkan jumlah kuadrat dari
selisih antara nilai prediksi dengan nilai rata-rata prediksi
atau dapat diperoleh dengan formula :

σ(𝑌෠ − 𝑌)
ത 2
2. Sum of Squares Residual = 8,800
Merupakan nilai yang menunjukkan jumlah kuadrat dari
selisih antara nilai riil dengan nilai prediksi, diperoleh
dengan formula sebagai berikut:
෠ .
Σ(Y-𝑌)²
3. Sum of Squares Total = 44,9004.
merupakan nilai yang menunjukkan jumlah kuadrat dari
selisih antara nilai riil dengan nilai rata-rata Y riil,
diperoleh dengan formula : Ʃ(Y - 𝑌) ത 2
4. Df Regression (Degree of Freedom Regression)
=1
Nilai Df Residual sebesar 8. Hal ini karena nilai n-k,
jumlah pengamatan dikurangi jumlah variabel (10-2=8).
Melakukan analisis anova menggunakan SPSS yang
dilakukan dengan langkah :
1. Buka file anova
2. Klik analyze, compare mean, one-way anova
3. Masukkan variabel produktivitas pada kotak dependen
4. Masukkan variabel jenis kelamin pada kotak factor
5. Abaikan pilihan lain, klik OK
Analisis Regresi dengan satu variabel kuantitatif dan satu
Variabel kualitatif dengan dua kategori

Anda mungkin juga menyukai