Anda di halaman 1dari 11

ANALISA VARIABEL DUMMY INDEPENDEN LINEAR DENGAN

REGRESI BERGANDA
1. Tinjauan Teoritis Analisa Dummy Variabel
Dummy variabel merupakan variabel-variabel yang sesungguhnya merupakan variabel yang
bersifat kulitatif (misal jenis kelamin yang dikelompokkan menjadi pria dan wanita, dll) yang
dirubah menjadi variabel kuantitatif berupa angka yang terdiri 0 (nol) dan 1. Ini menyebabkan
variabel dummy hanya terdiri dari dua jenis.
Analisa variabel dummy dengan regresi berganda biasanya digunakan untuk melihat
bagaimana variabel kulitatif ini dapat mempengaruhi suatu gejala atau pola tertentu yang dicoba
diteliti. Misal, kita mencoba untuk menguji bagaimana keterkaitan antara keikutsertaan petani pada
kelompok tani dapat mempengaruhi tingkat pendapatan rumah tangganya, maka analisa variabel
dummy perlu dilakukan. Dalam contoh ini, yang akan menjadi variabel dummy adalah
keikutsertaan petani pada kelompok tani, karena keikutsertaan ini tidak memiliki data kuantitatif.
Sedangkan variabel-variabel lainnya dijelaskan dengan data kuantitatif terkait. Kita dapat
mengkuantitatifkan variabel keikutsertaan petani ini dengan merubahnya menjadi dua variabel yang
berbeda, yaitu ikut-serta yang disimbolkan dengan angka 1 dan nol untuk petani yang tidak ikutserta. Tidak ada ketetapan untuk penentuan angka yang merepresentasikan pilihan ini, namun pada
umumnya peneliti menggunakan simbol angka 1 untuk keputusan yang bernilai positif (ikut serta
misalnya) dan angka nol untuk keputusan/pilihan yang bersifat negatif (tidak ikut serta misalnya),
namun untuk pilihan seperti wanita atau pria, pilihan agama, dll yang sejenis biasanya angka 1
menunjukan pilihan yang secara umum telah diketahui mendominasi, sedangkan angka 0 (nol)
untuk pilihan yang secara umum diketahui minoritas.
Dalam menemukan keterkaitan antara dua pilihan kualitatif yang ada ini, peneliti perlu
mencoba berbagai jenis model untuk memastikan model terbaik dalam menggambarkan realita.
Model-model ini terdiri dari model matematis yang dibentuk berdasarkan opsi (pilihan) model dari
variabel dummy, yaitu dummy intersept; dummy slope; dan dummy kombinasi. Ketiga jenis model
ini masih perlu disusun kembali berdasarkan banyaknya variabel yang mempengaruhi variabel
dependen yang dicari. Model-model ini disusun berdasarkan hal berikut,
Y = a + bX + c Di

(Model Dummy Intersep)

Y = a + bX + c (Di.X)

(Model Dummy Slope)

Y = a + bX + c (Di.X) + d Di

(Kombinasi; dapat berupa kombinasi intersep dengan slope,

atau slope dengan slope ketika dummy slope lebih dari satu, dan dapat pula dengan jenis kombinasi
lainnya yang memungkinkan)
dimana a adalah konstanta (intersep), b dan c adalah koefisien terkait, X adalah variabel bebas, dan

Di adalah variabel dummy yang nilainya bisa diisikan nol ataupun satu. Dummy kombinasi ini
sebenarnya dapat bervariasi seperti dijelaskan pada kalimat yang diblok kuning di atas. Untuk lebih
cepat membuat model persamaan dummy kombinasi terbaik, dari berbagai kemungkinan dummy
kombinasi lainnya dapat dilakukan dengan memperhatikan penyusun persamaannya. Kita bisa
membuatnya dengan menyusun persamaan yang terdiri dari kombinasi elemen persamaanpersamaan intersep dan slope dengan nilai F dan Adj. R 2 tertinggi. Sebagai contoh, ketika nilai uji F
dan Adj. R2 pada persamaan dummy intersep cukup tinggi, diiringi dengan nilai uji yang tinggi pula
untuk persamaan dummy slope bibit misalnya, maka kita dapat memilih untuk membuat kombinasi
antara dummy intersep dengan dummy slope bibit, ketimbang kita menyusun persamaan dummy
kombinasi dari dummy intersep dan dummy slope tenaga kerja atau yang lainnya.
Untuk perhitungan model dummy slope dan intersep, perhatikan hal berikut:
a. Untuk masing-masing variabel bebas yang mempengaruhi variabel terikat, perhatikan
model persamaannya.
b. Sebelum menganalisis dengan menggunakan SPSS (Analisa Regresi), perhatikan
terlebih dahulu faktor yang mempengaruhi variabel dependen atau terikatnya. Dalam
perhitungan ini, variabel yang mempengaruhi produksi yaitu tenaga kerja dan bibit.
Maka dalam persamaan regresi nantinya ditentukan terlebih dahulu nilai masingmasing variabel independen atau bebas yang mempengaruhi variabel dependennya.
Artinya kita membuat Di.Bibit dan Di.TK terlebih dahulu dengan cara mengalikan
data kedua variabel tersebut.
c. Bahkan untuk perhitungan dummy intersep, perlu diperhatikan bahwa regresi variabel
Di juga menghasilkan koefisien, sehingga koefisien ini wajib untuk dimasukkan dalam
persamaan matematisnya nanti. Penjelasan lebih lanjut aka disampaikan di bagian
selanjutnya.

2. Contoh Kasus
Disajikan data kegiatan petani di desa tertentu sebagai berikut,
Bibit
No.

(Kw)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

Bibit
33,33
150,00
140,85
150,00
24,00
83,33
49,12
69,44
60,00
103,45
130,00
103,45
172,41
72,09
34,97
83,33
15,00
32,17
60,00
22,35
45,00
52,63
140,85
117,19
31,01
140,00
41,96
50,88
92,98
169,01
62,00
172,41
327,59
120,69
62,50
190,00
244,76
186,05
183,10
106,90

ZA (Kw)
ZA
8,33
21,13
21,13
35,21
13,79
13,16
7,02
16,67
15,52
15,52
31,50
11,11
30,23
9,30
13,99
11,11
17,00
12,59
24,14
11,17
11,11
7,89
7,04
15,63
15,50
12,00
16,78
16,78
14,04
7,04
16,00
21,01
34,48
17,24
23,44
20,69
34,97
35,21
35,21
24,14

TK
(HKSP)
TK
121,00
287,00
278,87
220,69
140,80
220,69
170,18
194,44
124,00
155,17
210,50
137,93
186,21
127,91
162,24
252,78
196,50
155,24
210,50
173,74
150,00
145,00
160,56
150,00
126,36
290,14
184,62
126,32
156,14
210,50
178,00
258,62
424,14
290,14
210,50
172,00
367,61
290,14
290,14
220,69

Di
(1=kelompok,

Produksi

0=tidak)
Di
0
1
1
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
1
0
0
0
1
0
1
0
1
0
1
1
1
1

Prod
500
1600
1972
1750
1080
1096
789
903
900
966
2050
1034
1207
837
734
972
850
699
1750
740
900
614
1197
1172
620
1100
979
1053
1140
1127
1300
1207
1552
1379
1328
1200
2937
1860
2113
1655

41
42
43
44
45
46
47
48
49
50
51
52
53
54

42,02
155,17
139,53
224,14
105,26
23,33
85,00
204,23
104,65
209,30
138,89
211,27
320,69
315,00

21,01
20,69
30,23
24,14
24,14
12,50
17,00
21,13
35,21
13,95
8,33
35,21
24,14
21,13

220,69
220,69
210,50
290,14
290,14
182,00
168,00
220,69
351,16
195,35
255,56
340,85
220,69
240,35

1
1
0
1
1
0
1
1
1
0
0
1
1
1

1541
1379
1512
1552
2368
1133
950
2254
1593
1163
917
2394
2069
2750

Data di atas merupakan data mengenai tingkat produksi petani beserta dengan data
keterlibatan mereka dalam kelompok tani, dan juga tingkat penggunaan input pertanian mereka
berupa pupuk ZA dan bibit, serta tenaga kerja. Keterlibatan petani pada kelompok tani dapat
dijelaskan sebagai berikut,
1. Petani yang tergabung dalam kelompok tani mempunyai kegiatan berikut:
a. Pelatihan tenaga kerja, kegiatan yang dilakukan meliputi:

Kegiatan penyuluhan

Teknis budidaya tanaman

Pelatihan petani dalam berusahatani

b. Pembibitan, kegiatan yang dilakukan meliputi:

Pemeliharaan bibit

Perlakuan bibit selama budidaya tanaman

Mendapatkan bibit berkualitas

2. Petani yang tidak tergabung dalam kelompok tani tidak mempunyai kegiatan apa-apa, dan
umumnya para petani bersifat individualis.
Kemudian kita diminta untuk bisa memprediksi bagaimana pengaruh keikutsertaan petani
pada kelompok tani terhadap hasil produksi mereka! Perhatikan dalam penjabaran kegiatan petani
yang terlibat dalam kelompok tani, dapat diketahui bahwa kualitas tenaga kerja mempengaruhi
produksi, beserta dengan bibit dan penggunaan pupuk ZA. Maka kita dapat menganggap jika petani
terlibat kelompok tani, maka variabel tenaga kerja, ZA, dan bibit akan lebih berpengaruh pada
tignkat produksinya dibandingkan dengan petani yang tidak ikut kelompok tani.
Untuk dapat melihat bagaimana keterlibatan petani dalam kelompok tani dapat mempengaruhi
hasil produksi mereka tentunya tidak cukup dengan menggunakan regresi berganda seperti biasanya

karena dalam kasus ini melibatkan variabel kulitatif Dummy.

Pada praktikum ini, kita

mengasumsikan data bersifat linear dan memiliki sebaran yang telah merata, sehingga kita tidak
perlu melakukan normalisasi data dengan transformasi variabel menjadi bentuk logaritma natural
(Ln). Langkah kerja untuk melakukan analisa dummy variabel linear ini disajikan sebagai berikut,
Data memiliki sebaran merata dan asumsi
data bersifat linear

Analisa regresi berganda untuk


berbagai variabel yang dianggap
mempengaruhi variabel dependen
(dlm hal ini adalah Prod) pakai SPSS

Dummy intersept
Dummy slope
Dummy kombinasi

Membentuk tiga jenis model persamaan


matematis, yaitu model dummy intersep, dummy
slope, dummy kombinasi (pilih satu jenis saja untuk
dummy kombinasinya)

Uji kelayakan model yg mendekati realita


(berdasar uji dlm SPSS dan logika ekonomi)

Uji dengan logika ekonomi;


Uji nilai tertinggi F dan Adj. R2

Menemukan model terbaik untuk memprediksi

3. Langkah Kerja dengan SPSS


Langkah kerja dalam SPSS ini bertujuan untuk mencari bentuk persamaan matematis
berdasarkan model persamaan dari dummy intersep, dummy slope, dan dummy kombinasi. Karena
variasi persamaan yang dapat dibentuk dalam persamaan dummy kombinasi ada banyak, untuk
efisiensi dan keefektifan waktu sebaiknya kita membentuk sendiri dummy kombinasi berdasarkan
cara yang telah dijelaskan sebelumnya. Analisa SPSS ini menggunakan regresi berganda dan
dilakukan hingga lima kali sesuai dengan banyaknya model persamaan matematis yang diinginkan
(kita memilih lima saja, yaitu persamaan dummy intersep, dummy slope bibit, dummy slope tenaga
kerja, dummy slope penggunaan pupuk ZA, dan dummy kombinasi slope bibit dengan slope tenaga
kerja).
1.

Kita perlu membuat variabel tambahan yang telah dipengaruhi oleh variabel dummy. Perlu
diperhatikan bahwa variabel-variabel yang dikalikan dengan variabel dummy ini dilakukan
jika variabel independen selain dummy tersebut (seperti variabel bibit misalnya) diketahui

juga dipengaruhi oleh variabel dummy, sehingga variabel ini pengaruhnya pada variabel
dependen (variabel produksi) akan semakin besar ketika nilai dummy adalah 1, dan jika
nilainya nol maka variabel ini akan berpengaruh sama dengan petani yang tidak mengikuti
kelompok tani. Variabel-variabel tersebut adalah variabel dummy mempengaruhi bibit, ZA,
dan tenaga kerja (TK). Maka, kita perlu mengalikan variabel dummy ini dengan variabel
bibit, dummy dengan ZA, dan dummy dengan tenaga kerja (TK). Sehingga akan
menghasilkan Di.Bibit; Di.ZA; dan Di.TK. Lakukan ini pada Excel untuk mempercepat
waktu.
2. Copy data yang ada pada jendela SPSS seperti biasanya, lalu rubah nama variabelnya sesuai
dengan data yang ada pada sheet Variabel View
3. Klik menu Analyze > Regression > Linear
4. Masukkan Variabel Produksi sebagai variabel Dependent
5. Pada tahap selanjutnya ini, kita akan membuat persamaan matematis berdasarkan bentuk
persamaan dummy intersep, maka kita memasukan variabel Bibit, TK, ZA, dan Di pada
kolom variabel Independent.
6. Klik OK
7. Untuk membuat persamaan matematis berdasarkan bentuk persamaan dummy slope,
lakukan langkah 3 hingga 6, pada kolom variabel Independent tetap diisikan dengan Bibit,
TK, ZA, namun variabel Di dikeluarkan dan diganti dengan variabel dummy
mempengaruhi..... Misal kita membuat dummy slope bibit, maka variabel dummy
mempengaruhi Bibit dimasukkan, yaitu variabel Di.Bibit.

Begitupun untuk dummy

slope lainnya, kita mengisikan Di.ZA untuk dummy slope ZA dan Di.TK untuk dummy
slope tenaga kerja.
8. Untuk membuat persamaan matematis berdasar dummy kombinasi, maka lakukan langkah 3
hingga 6. Pada kolom variabel independen tetap dimasukkan variabel Bibit, ZA, dan TK,
namun ditambahkan dengan variabel dummy mempengaruhi.... sesuai dengan kombinasi
yang diinginkan. Jika diinginkan kombinasi intersep dengan slope bibit, maka masukkan
variabel Di dan Di.Bibit; jika diinginkan kombinasi slope bibit dengan slope TK misalnya,
maka masukkan variabel Di.Bibit dan Di.TK.

4. Cara Melakukan Interpretasi Output SPSS


1. Perhatikan tabel Model Summary
Model Summary
Adjusted R
Model R
1

.854

Std. Error of

R Square Square

the Estimate

.729

299.13644

.707

a. Predictors: (Constant), Di, BBT, ZA, TK


Perhatikan nilai Adjusted R Square-nya dan interpretasikan seperti biasanya (lihat di
modul tutorial Persamaan Simultan untuk detail cara interpretasinya).
2. Pada tabel ANOVA
ANOVAb
Sum of
Model
1

Squares
Regression 1.182E7

Df

Mean Square F

Sig.

2954023.820 33.012

.000a

Residual

4384647.926 49

Total

1.620E7

89482.611

53

a. Predictors: (Constant), Di, BBT, ZA, TK


b. Dependent Variable: PROD
Cukup lihat nilai signifikansi dari uji F. Interpretasikan seperti biasa. Batas toleransi
kesalahan 5%.
3. Pada tabel Coefficient
Coefficientsa

Model
1

Unstandardized

Standardized

Coefficients

Coefficients

Std. Error

Beta

Sig.

3.126

.003

(Constant) 478.503

153.067

BBT

2.533

.686

.358

3.694

.001

ZA

19.158

7.189

.296

2.665

.010

TK

.078

.931

.010

.084

.933

Di

402.112

114.008

.365

3.527

.001

a. Dependent Variable: PROD


Intepretasikan signifikansi pada hasil konstanta dan koefisiennya. Jangan lupa kita
menggunakan batas toleransi kesalahan 5%.
4. Kita telah mengetahui konstanta dan koefisien sesuai dengan hasil tabel di atas, karena ini
adalah contoh untuk membuat persamaan intersep, maka kita membuat persamaan
matematisnya sebagai berikut,

Y (Produksi) = 478,503 + 2,533X1 (Bibit) + 19,158X2 (Pupuk) + 0,078X3 (TK) +


402,112Di
Artinya:
Setiap kenaikan 1 unit bibit akan meningkatkan produksi sebesar 2,533 unit
Setiap kenaikan 1 unit pupuk akan meningkatkan produksi sebesar 19,158 unit
Setiap kenaikan 1 unit TK akan meningkatkan produksi sebesar 0,078 unit
5. Untuk mengetahui rasional atau tidaknya nilai diatas perlu dilakukan pengujian dengan
menggunakan persamaan dummy intersep. Pada tabel di atas koefisiennya menunjukan nilai
yang positif semua dan dummy intersep mempunyai nilai adjusted R square dan nilai F yang
tinggi maka
Y = + 1X1 + 2X2 + 3X3 + 4 Di
Dalam hal ini terdapat dua asumsi tentang Di yaitu Di = 1 jika petani mengikuti kelompok
tani dan Di = 0 jika petani tidak mengikuti kelompok tani.
Jika Di = 1
Y = 478,503 + 2,533X1 + 19,158X2 + 0.078X3 + 402,112Di
= 478,503 + 2,533X1 + 19,158X2 + 0.078X3 + 402,112(1)
= 880,615 + 2.533X1 + 19,158X2 + 0.078X3
Jika Di = 0
Y = 478,503 + 2,533X1 + 19,158X2 + 0.078X3 + 402,112Di
= 478,503 + 2,533X1 + 19,158X2 + 0.078X3 + 402,112(0)
= 478,503 + 2,533X1 + 19,158X2 + 0.078X3
D=1 menunjukkan dummy untuk petani yang tergabung dalam kelompok tani. Sedangkan
D=0 menunjukkan dummy untuk petani yang tidak mengikuti kelompok tani. Nilai intersep
pada kedua model di atas dapat diibaratkan sebagai biaya tetap (fixed cost). Dari kedua
persamaan terdapat interval antara Y (Di = 1) dengan Y (Di = 0) terlalu ekstrim hampir
100% secara logika ekonomi tidak diterima karena petani yang baru saja mengikuti
kelompok tani bisa memperoleh Y hampir 100%. Dalam teori ekonomi dan dunia nyata,
sangat tidak dimungkinkan apabila petani yang tidak mengikuti kelompok tani akan
mengalami perbedaan FC yang begitu jauh apabila dibandingkan dengan petani yang tidak
mengikuti kelompok tani. Maka meskipun nilai adjusted R square dan nilai F nya tinggi
akan tetapi syarat logika ekonomi tidak terpenuhi maka dummy intersep ini ditolak atau
tidak baik.
6. Interpretasikan semua hasil output SPSS lainnya untuk pembentukan persamaan yang lain,
yaitu persamaan dummy slope Bibit, dummy slope Tenaga Kerja, dummy slope ZA, dan
dummy kombinasi yang kalian pilih. Setelah masing-masing persamaan tersebut dibuat

menjadi persamaan matematis seperti pada poin nomor 4 di atas, lakukan uji Rasionalisasi
Ekonomi seperti pada poin nomor 5. Ini membantu untuk membuat tabel rekapitulasi untuk
memilih model persamaan yang paling baik memprediksi data aktual.
7. Berikut diberikan bentuk persamaan untuk membantu memahami pembentukan persamaan
matematika dari jenis dummy slope dan kombinasi
a. Dummy slope Bibit
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X1 [Dummy Bibit]
b. Dummy slope Tenaga Kerja
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X3 [Dummy TK]
c. Dummy slope ZA
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X2 [Dummy ZA]
d. Dummy Kombinasi Intersep dan Slope Bibit (sebagai contoh kombinasi yg dipilih)
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X1 [Dummy Bibit] + 5
Di

5. Pemilihan Persamaan Matematika Terbaik


Langkah terakhir ini digunakan untuk memilih persamaan matematika terbaik dalam
memprediksi pengaruh keikutsertaan petani terhadap tingkat produksinya. Kita menyaring
persamaan-persamaan yang telah kita buat seperti yang kita lakukan sebelumnya dengan melihat
nilai Adjusted R Square, nilai uji F, dan kesesuaiannya dengan logika ekonomi (lihat contohnya
berikut di kolom teori). Jika dilakukan dengan benar, maka kita akan memperoleh hasil rekapitulasi
seperti di bawah ini.
Uji Variabel

Adjusted R Square

Nilai F

Teori
Nilai koefisien

Dummy Intersep

0,707

33,012

uji t positif -->


tidak sesuai teori
Nilai koefisien

Dummy Slope Bibit

0,689

30,407

uji t positif -->


sesuai teori
Nilai koefisien

Dummy Slope ZA

0,708

33,132

uji t ada yang


negatif --> tidak
sesuai teori
Nilai koefisien

Dummy Slope
Tenaga Kerja

0,694

31,027

uji t ada yang


negatif --> tidak

sesuai teori
Perhatikan kasus pada tabel rekapitulasi di atas, terdapat informasi yang diberi blok merah.
Informasi yang diberi blok merah ini menunjukan adanya ketidaksesuaian logika ekonomi dengan
salah satu tanda pada koefisien yang terbentuk dari analisa regresi berganda yang kita lakukan
sebelumnya. Kebetulan kedua informasi yang tidak sesuai dengan logika ekonomi tersebut ada pada
satu variabel yang sama, yaitu pada variabel Tenaga Kerja (TK). Tanda koefisien TK pada kedua
persamaan tersebut memberikan nilai negatif, sehingga tidak sesuai dengan logika ekonomi karena
semakin variabel TK berbanding lurus dengan tingkat produksi petani. Contoh ini menekankan
bahwa tidak selalu nilai koefisien yang negatif menandakan persamaan tersebut tidak sesuai dengan
logika ekonomi. Kebetulan juga dalam contoh ini tidak disajikan hasil analisa regresi berganda dari
persamaan dummy kombinasi, namun dalam praktikum maupun ujian, analisa persamaan dummy
kombinasi wajib dimasukkan dan menjadi salah satu pertimbangan dalam memilih persamaan
matematika terbaik.
Berdasarkan tabel tersebut dapat dilihat bahwa urutan nilai adjusted R square dari yang
tertinggi ke terendah adalah dummy slope ZA (0,708); dummy intersept (0,707); dummy slope

tenaga kerja (0,694) dan dummy slope bibit (0,689). Sedangkan urutan nilai F dari yang tertinggi ke
terendah adalah dummy slope ZA (33,132); dummy intersep (33,012); dummy slope tenaga kerja
(31,027); dan dummy slope bibit (30,407). Adjusted R square yang tinggi biasanya diikuti dengan
nilai F yang tinggi pula.
Untuk mendapatkan model yang tepat, nilai adjusted R square harus tinggi dan nilai F harus
signifikan. Selain itu, model harus sesuai dengan teori ekonomi yang berlaku. Satu saja tanda
koefisien yang tidak sesuai dengan logika ekonomi akan membuat persamaan itu gugur dalam
pertimbangan. Dari rekapitulasi model tersebut, maka persamaan atau model yang tepat untuk
menggambarkan hubungan variabel bibit, tenaga kerja, pupuk ZA terhaap produksi tebu adalah
sebagai berikut:
Untuk D0 (petani tidak mengikuti kel. tani ) Y= 550.748 + 1.024X1 + 23.204X2 + 0.270X3
Untuk D1 (petani megikuti kel. tani), Y = 550.748 + 3.424X1 + 23.204X2 + 0.270X3