REGRESI BERGANDA
1. Tinjauan Teoritis Analisa Dummy Variabel
Dummy variabel merupakan variabel-variabel yang sesungguhnya merupakan variabel yang
bersifat kulitatif (misal jenis kelamin yang dikelompokkan menjadi pria dan wanita, dll) yang
dirubah menjadi variabel kuantitatif berupa angka yang terdiri 0 (nol) dan 1. Ini menyebabkan
variabel dummy hanya terdiri dari dua jenis.
Analisa variabel dummy dengan regresi berganda biasanya digunakan untuk melihat
bagaimana variabel kulitatif ini dapat mempengaruhi suatu gejala atau pola tertentu yang dicoba
diteliti. Misal, kita mencoba untuk menguji bagaimana keterkaitan antara keikutsertaan petani pada
kelompok tani dapat mempengaruhi tingkat pendapatan rumah tangganya, maka analisa variabel
dummy perlu dilakukan. Dalam contoh ini, yang akan menjadi variabel dummy adalah
keikutsertaan petani pada kelompok tani, karena keikutsertaan ini tidak memiliki data kuantitatif.
Sedangkan variabel-variabel lainnya dijelaskan dengan data kuantitatif terkait. Kita dapat
mengkuantitatifkan variabel keikutsertaan petani ini dengan merubahnya menjadi dua variabel yang
berbeda, yaitu ikut-serta yang disimbolkan dengan angka 1 dan nol untuk petani yang tidak ikutserta. Tidak ada ketetapan untuk penentuan angka yang merepresentasikan pilihan ini, namun pada
umumnya peneliti menggunakan simbol angka 1 untuk keputusan yang bernilai positif (ikut serta
misalnya) dan angka nol untuk keputusan/pilihan yang bersifat negatif (tidak ikut serta misalnya),
namun untuk pilihan seperti wanita atau pria, pilihan agama, dll yang sejenis biasanya angka 1
menunjukan pilihan yang secara umum telah diketahui mendominasi, sedangkan angka 0 (nol)
untuk pilihan yang secara umum diketahui minoritas.
Dalam menemukan keterkaitan antara dua pilihan kualitatif yang ada ini, peneliti perlu
mencoba berbagai jenis model untuk memastikan model terbaik dalam menggambarkan realita.
Model-model ini terdiri dari model matematis yang dibentuk berdasarkan opsi (pilihan) model dari
variabel dummy, yaitu dummy intersept; dummy slope; dan dummy kombinasi. Ketiga jenis model
ini masih perlu disusun kembali berdasarkan banyaknya variabel yang mempengaruhi variabel
dependen yang dicari. Model-model ini disusun berdasarkan hal berikut,
Y = a + bX + c Di
Y = a + bX + c (Di.X)
Y = a + bX + c (Di.X) + d Di
atau slope dengan slope ketika dummy slope lebih dari satu, dan dapat pula dengan jenis kombinasi
lainnya yang memungkinkan)
dimana a adalah konstanta (intersep), b dan c adalah koefisien terkait, X adalah variabel bebas, dan
Di adalah variabel dummy yang nilainya bisa diisikan nol ataupun satu. Dummy kombinasi ini
sebenarnya dapat bervariasi seperti dijelaskan pada kalimat yang diblok kuning di atas. Untuk lebih
cepat membuat model persamaan dummy kombinasi terbaik, dari berbagai kemungkinan dummy
kombinasi lainnya dapat dilakukan dengan memperhatikan penyusun persamaannya. Kita bisa
membuatnya dengan menyusun persamaan yang terdiri dari kombinasi elemen persamaanpersamaan intersep dan slope dengan nilai F dan Adj. R 2 tertinggi. Sebagai contoh, ketika nilai uji F
dan Adj. R2 pada persamaan dummy intersep cukup tinggi, diiringi dengan nilai uji yang tinggi pula
untuk persamaan dummy slope bibit misalnya, maka kita dapat memilih untuk membuat kombinasi
antara dummy intersep dengan dummy slope bibit, ketimbang kita menyusun persamaan dummy
kombinasi dari dummy intersep dan dummy slope tenaga kerja atau yang lainnya.
Untuk perhitungan model dummy slope dan intersep, perhatikan hal berikut:
a. Untuk masing-masing variabel bebas yang mempengaruhi variabel terikat, perhatikan
model persamaannya.
b. Sebelum menganalisis dengan menggunakan SPSS (Analisa Regresi), perhatikan
terlebih dahulu faktor yang mempengaruhi variabel dependen atau terikatnya. Dalam
perhitungan ini, variabel yang mempengaruhi produksi yaitu tenaga kerja dan bibit.
Maka dalam persamaan regresi nantinya ditentukan terlebih dahulu nilai masingmasing variabel independen atau bebas yang mempengaruhi variabel dependennya.
Artinya kita membuat Di.Bibit dan Di.TK terlebih dahulu dengan cara mengalikan
data kedua variabel tersebut.
c. Bahkan untuk perhitungan dummy intersep, perlu diperhatikan bahwa regresi variabel
Di juga menghasilkan koefisien, sehingga koefisien ini wajib untuk dimasukkan dalam
persamaan matematisnya nanti. Penjelasan lebih lanjut aka disampaikan di bagian
selanjutnya.
2. Contoh Kasus
Disajikan data kegiatan petani di desa tertentu sebagai berikut,
Bibit
No.
(Kw)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Bibit
33,33
150,00
140,85
150,00
24,00
83,33
49,12
69,44
60,00
103,45
130,00
103,45
172,41
72,09
34,97
83,33
15,00
32,17
60,00
22,35
45,00
52,63
140,85
117,19
31,01
140,00
41,96
50,88
92,98
169,01
62,00
172,41
327,59
120,69
62,50
190,00
244,76
186,05
183,10
106,90
ZA (Kw)
ZA
8,33
21,13
21,13
35,21
13,79
13,16
7,02
16,67
15,52
15,52
31,50
11,11
30,23
9,30
13,99
11,11
17,00
12,59
24,14
11,17
11,11
7,89
7,04
15,63
15,50
12,00
16,78
16,78
14,04
7,04
16,00
21,01
34,48
17,24
23,44
20,69
34,97
35,21
35,21
24,14
TK
(HKSP)
TK
121,00
287,00
278,87
220,69
140,80
220,69
170,18
194,44
124,00
155,17
210,50
137,93
186,21
127,91
162,24
252,78
196,50
155,24
210,50
173,74
150,00
145,00
160,56
150,00
126,36
290,14
184,62
126,32
156,14
210,50
178,00
258,62
424,14
290,14
210,50
172,00
367,61
290,14
290,14
220,69
Di
(1=kelompok,
Produksi
0=tidak)
Di
0
1
1
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
1
0
0
0
1
0
1
0
1
0
1
1
1
1
Prod
500
1600
1972
1750
1080
1096
789
903
900
966
2050
1034
1207
837
734
972
850
699
1750
740
900
614
1197
1172
620
1100
979
1053
1140
1127
1300
1207
1552
1379
1328
1200
2937
1860
2113
1655
41
42
43
44
45
46
47
48
49
50
51
52
53
54
42,02
155,17
139,53
224,14
105,26
23,33
85,00
204,23
104,65
209,30
138,89
211,27
320,69
315,00
21,01
20,69
30,23
24,14
24,14
12,50
17,00
21,13
35,21
13,95
8,33
35,21
24,14
21,13
220,69
220,69
210,50
290,14
290,14
182,00
168,00
220,69
351,16
195,35
255,56
340,85
220,69
240,35
1
1
0
1
1
0
1
1
1
0
0
1
1
1
1541
1379
1512
1552
2368
1133
950
2254
1593
1163
917
2394
2069
2750
Data di atas merupakan data mengenai tingkat produksi petani beserta dengan data
keterlibatan mereka dalam kelompok tani, dan juga tingkat penggunaan input pertanian mereka
berupa pupuk ZA dan bibit, serta tenaga kerja. Keterlibatan petani pada kelompok tani dapat
dijelaskan sebagai berikut,
1. Petani yang tergabung dalam kelompok tani mempunyai kegiatan berikut:
a. Pelatihan tenaga kerja, kegiatan yang dilakukan meliputi:
Kegiatan penyuluhan
Pemeliharaan bibit
2. Petani yang tidak tergabung dalam kelompok tani tidak mempunyai kegiatan apa-apa, dan
umumnya para petani bersifat individualis.
Kemudian kita diminta untuk bisa memprediksi bagaimana pengaruh keikutsertaan petani
pada kelompok tani terhadap hasil produksi mereka! Perhatikan dalam penjabaran kegiatan petani
yang terlibat dalam kelompok tani, dapat diketahui bahwa kualitas tenaga kerja mempengaruhi
produksi, beserta dengan bibit dan penggunaan pupuk ZA. Maka kita dapat menganggap jika petani
terlibat kelompok tani, maka variabel tenaga kerja, ZA, dan bibit akan lebih berpengaruh pada
tignkat produksinya dibandingkan dengan petani yang tidak ikut kelompok tani.
Untuk dapat melihat bagaimana keterlibatan petani dalam kelompok tani dapat mempengaruhi
hasil produksi mereka tentunya tidak cukup dengan menggunakan regresi berganda seperti biasanya
mengasumsikan data bersifat linear dan memiliki sebaran yang telah merata, sehingga kita tidak
perlu melakukan normalisasi data dengan transformasi variabel menjadi bentuk logaritma natural
(Ln). Langkah kerja untuk melakukan analisa dummy variabel linear ini disajikan sebagai berikut,
Data memiliki sebaran merata dan asumsi
data bersifat linear
Dummy intersept
Dummy slope
Dummy kombinasi
Kita perlu membuat variabel tambahan yang telah dipengaruhi oleh variabel dummy. Perlu
diperhatikan bahwa variabel-variabel yang dikalikan dengan variabel dummy ini dilakukan
jika variabel independen selain dummy tersebut (seperti variabel bibit misalnya) diketahui
juga dipengaruhi oleh variabel dummy, sehingga variabel ini pengaruhnya pada variabel
dependen (variabel produksi) akan semakin besar ketika nilai dummy adalah 1, dan jika
nilainya nol maka variabel ini akan berpengaruh sama dengan petani yang tidak mengikuti
kelompok tani. Variabel-variabel tersebut adalah variabel dummy mempengaruhi bibit, ZA,
dan tenaga kerja (TK). Maka, kita perlu mengalikan variabel dummy ini dengan variabel
bibit, dummy dengan ZA, dan dummy dengan tenaga kerja (TK). Sehingga akan
menghasilkan Di.Bibit; Di.ZA; dan Di.TK. Lakukan ini pada Excel untuk mempercepat
waktu.
2. Copy data yang ada pada jendela SPSS seperti biasanya, lalu rubah nama variabelnya sesuai
dengan data yang ada pada sheet Variabel View
3. Klik menu Analyze > Regression > Linear
4. Masukkan Variabel Produksi sebagai variabel Dependent
5. Pada tahap selanjutnya ini, kita akan membuat persamaan matematis berdasarkan bentuk
persamaan dummy intersep, maka kita memasukan variabel Bibit, TK, ZA, dan Di pada
kolom variabel Independent.
6. Klik OK
7. Untuk membuat persamaan matematis berdasarkan bentuk persamaan dummy slope,
lakukan langkah 3 hingga 6, pada kolom variabel Independent tetap diisikan dengan Bibit,
TK, ZA, namun variabel Di dikeluarkan dan diganti dengan variabel dummy
mempengaruhi..... Misal kita membuat dummy slope bibit, maka variabel dummy
mempengaruhi Bibit dimasukkan, yaitu variabel Di.Bibit.
slope lainnya, kita mengisikan Di.ZA untuk dummy slope ZA dan Di.TK untuk dummy
slope tenaga kerja.
8. Untuk membuat persamaan matematis berdasar dummy kombinasi, maka lakukan langkah 3
hingga 6. Pada kolom variabel independen tetap dimasukkan variabel Bibit, ZA, dan TK,
namun ditambahkan dengan variabel dummy mempengaruhi.... sesuai dengan kombinasi
yang diinginkan. Jika diinginkan kombinasi intersep dengan slope bibit, maka masukkan
variabel Di dan Di.Bibit; jika diinginkan kombinasi slope bibit dengan slope TK misalnya,
maka masukkan variabel Di.Bibit dan Di.TK.
.854
Std. Error of
R Square Square
the Estimate
.729
299.13644
.707
Squares
Regression 1.182E7
Df
Mean Square F
Sig.
2954023.820 33.012
.000a
Residual
4384647.926 49
Total
1.620E7
89482.611
53
Model
1
Unstandardized
Standardized
Coefficients
Coefficients
Std. Error
Beta
Sig.
3.126
.003
(Constant) 478.503
153.067
BBT
2.533
.686
.358
3.694
.001
ZA
19.158
7.189
.296
2.665
.010
TK
.078
.931
.010
.084
.933
Di
402.112
114.008
.365
3.527
.001
menjadi persamaan matematis seperti pada poin nomor 4 di atas, lakukan uji Rasionalisasi
Ekonomi seperti pada poin nomor 5. Ini membantu untuk membuat tabel rekapitulasi untuk
memilih model persamaan yang paling baik memprediksi data aktual.
7. Berikut diberikan bentuk persamaan untuk membantu memahami pembentukan persamaan
matematika dari jenis dummy slope dan kombinasi
a. Dummy slope Bibit
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X1 [Dummy Bibit]
b. Dummy slope Tenaga Kerja
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X3 [Dummy TK]
c. Dummy slope ZA
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X2 [Dummy ZA]
d. Dummy Kombinasi Intersep dan Slope Bibit (sebagai contoh kombinasi yg dipilih)
Y [Produksi] = + 1X1 [Bibit] + 2X2 [ZA] + 3X3 [TK] + 4 Di.X1 [Dummy Bibit] + 5
Di
Adjusted R Square
Nilai F
Teori
Nilai koefisien
Dummy Intersep
0,707
33,012
0,689
30,407
Dummy Slope ZA
0,708
33,132
Dummy Slope
Tenaga Kerja
0,694
31,027
sesuai teori
Perhatikan kasus pada tabel rekapitulasi di atas, terdapat informasi yang diberi blok merah.
Informasi yang diberi blok merah ini menunjukan adanya ketidaksesuaian logika ekonomi dengan
salah satu tanda pada koefisien yang terbentuk dari analisa regresi berganda yang kita lakukan
sebelumnya. Kebetulan kedua informasi yang tidak sesuai dengan logika ekonomi tersebut ada pada
satu variabel yang sama, yaitu pada variabel Tenaga Kerja (TK). Tanda koefisien TK pada kedua
persamaan tersebut memberikan nilai negatif, sehingga tidak sesuai dengan logika ekonomi karena
semakin variabel TK berbanding lurus dengan tingkat produksi petani. Contoh ini menekankan
bahwa tidak selalu nilai koefisien yang negatif menandakan persamaan tersebut tidak sesuai dengan
logika ekonomi. Kebetulan juga dalam contoh ini tidak disajikan hasil analisa regresi berganda dari
persamaan dummy kombinasi, namun dalam praktikum maupun ujian, analisa persamaan dummy
kombinasi wajib dimasukkan dan menjadi salah satu pertimbangan dalam memilih persamaan
matematika terbaik.
Berdasarkan tabel tersebut dapat dilihat bahwa urutan nilai adjusted R square dari yang
tertinggi ke terendah adalah dummy slope ZA (0,708); dummy intersept (0,707); dummy slope
tenaga kerja (0,694) dan dummy slope bibit (0,689). Sedangkan urutan nilai F dari yang tertinggi ke
terendah adalah dummy slope ZA (33,132); dummy intersep (33,012); dummy slope tenaga kerja
(31,027); dan dummy slope bibit (30,407). Adjusted R square yang tinggi biasanya diikuti dengan
nilai F yang tinggi pula.
Untuk mendapatkan model yang tepat, nilai adjusted R square harus tinggi dan nilai F harus
signifikan. Selain itu, model harus sesuai dengan teori ekonomi yang berlaku. Satu saja tanda
koefisien yang tidak sesuai dengan logika ekonomi akan membuat persamaan itu gugur dalam
pertimbangan. Dari rekapitulasi model tersebut, maka persamaan atau model yang tepat untuk
menggambarkan hubungan variabel bibit, tenaga kerja, pupuk ZA terhaap produksi tebu adalah
sebagai berikut:
Untuk D0 (petani tidak mengikuti kel. tani ) Y= 550.748 + 1.024X1 + 23.204X2 + 0.270X3
Untuk D1 (petani megikuti kel. tani), Y = 550.748 + 3.424X1 + 23.204X2 + 0.270X3