1
sebenarnya dapat dilakukan untuk mendekati SSE dari suatu model regresi nonlinear, namun
kesulitannya terletak pada pengiraan nilai parametemya (Lihat Gujarati, 2004, Bab 14). Oleh
karena itu, ada beberapa metode yang dapat digunakan untuk mengestimasi suatu model
nonlinear, yaitu:
1. Metode coba dan ralat (trial aud error)
Pada metode ini, kita mencoba-coba memasukkan heberapa nilai β pada persamaan
regresinya, kemudian menghitung galat kuadrat jumlahnya. Model terbaiknya adalah
apabila galat kuadrat jumlahnya mernpunyai nilai terkecil, Metode ini sepertinya mudah
untuk dilakukan. Saycngnya, metode ini mernpunyai banyak kelemahan.
Kelemahan metode ini adalah kita hams mempunyai pengetahuan masa lalu tentang data
yang akan kita modelkan 'sehingga kita dapat mengestimasi nilai β dari data tersebut.
Kelemahan lainnya adalah tidak adanya jaminan bahwa parameter yang dipilih
mernberikan nilai SSE yang minimum, apalagi jika kita akan mengestimasi parameter
yang berjurnlah lebih dari dua, misalnya 4, dan dengan jumlah altematif nilai β sebanyak
20, kita akan menghitung nilai SSE sebanyak (20) 4 = 160.000 kali. Walaupun dapat dibuat
suatu algoritme, tetap saja proses ini membutuhkan waktu yang lama.
2. Metode optimalisasi langsung (direct optimization)
Metode ini dilakukan dengan cara menurunkan pcrsamaan SSE dengan suatu nilai
parameter atau koefisien yang tidak diketahui, menyamakan persamaan tersebut dengan
nol, dan menyelesaikannya secara simultan.
Metode ini tidak dapat diselesaikan dengan mudah (secara eksplisit) sehingga teknik cob a
dan ralat untuk menentukan nilai parameternya tetap diperlukan. Meskipun begitu,
prosesnya lebih sistematis daripada metode cob a dan ralat. Kelemahan dari metode ini
adalah prosesnya sangat lambat untuk mencapai nilai estimasi yang konvergen.
3. Metode linearisasi iteratif (iterative linearization)
Pada metode ini, kita akan melinearkan model nonlineamya, yang kemudian pararneternya
akan kita estimasi dengan metode OLS menggunakan suatu nilai inisial yang disesuaikan
(adjusted). Selanjutnya, nilai tersebut digunakan untuk merelinearisasi irelinearizev
modelnya, lalu kita akan mengestimasi parameternya lagi, kita akan menyesuaikan
nilainya lagi. Proses ini diulang ulang hingga nilai estimasi tidak berubah dari dua nilai
estimasi terakhir.
2
Teknik yang dilakukan untuk melinearkan model nonlinear ini adalah teknik kalkulus seri
Taylor, yaitu dengan metode iterasi Gauss-Newton dan NewtonRaphson. Beberapa
program komputer juga sudah menggunakan metode ini.
8.2 MODEL REGRESI DUMI
Model regresi dengan menggunakan variabel dumi (boneka) sering dij umpai pada
beberapa kasus ekonomi. Model ini dipakai apahila variabel explanatory atau variabel
pcnjelasnya mempunyai strukrur data kualitatif (nominal atau ordinal), misalnya untuk
mengukur tingkat pendapatan pekerja di suatu kabupaten yang diperkirakan dipengaruhi oleh
jenis kelarnin dan pendidikan. Jenis kelamin dapat dikategorikan sebagai 0 untuk wanita dan
1 untuk pria, pendidikan 0 untuk kurang atau sama dengan SD, 1 untuk SMP, 2 untuk SMA,
dan 3 untuk di atas SMA. 'Variabel jenis kelamin dan pendidikan tersebut dapat disebut
sebagai suatu variabel dumi,
1. Metode Analisis untuk Variabel Dumi
Suatu model regresi, variabel penjelasnya dapat berupa kornbinasi antara variabel
kualitatif dan kuantitatif, namun dapat pula seluruhnya berupa variabel kuantitatif atau
kualitatif. Analisis untuk model regresi yang keseluruhan variabel penjelasnya adalah
variabel kualitatif dapat menggunakan analisis variansi (analysis of variance [ANOVA]).
TABEL 8.2 adalah data jumlah pengangguran dan PDRB di Indonesia pada tahun 2005
pada riga wilayah propinsi, yang wilayahnya dibedakan atas dasar kedekatan dengan pusat
pemerintahan, yaitu Jakarta. Wilayah 1 adalah wilayah Indonesia Barat, selain Jawa dan
Bali, Wilayah 2 adalah propinsi-propinsi yang ada di Jawa dan Bali, sedangkan Wilayah 3
adalah propinsi-propinsi di Indonesia Timur dan Tengah, selain Bali. Seandainya kita
ingin mengetahui apakah ada perbedaan rata rata PDRB di ketiga wilayah tersebut, kita
dapat mernbentuk suatu model regresi seperti berikut:
Y i= β1 + β 2 D 2i +β 3 D3 i +ε i (8.4)
Yi = rata-rata PDRB pada wilayah ke-i
D2i = 1; wilayah 1
= 0; wilayah lainnya
D3i = 1; wilayah 2
= 0; wilayah lainnya
Rata-rata PDRB per wilayah dapat dirumuskan sebagai berikut:
Rata-rata PDRB untuk wilayah 1 adalah:
E (Y i|D2i =1 D3 i =0)=β 1 +β 2 (8.5)
3
Rata-rata PDRB untuk wilayah 2 adalah:
E (Y i|D2i =1 D3 i =0)=β 1 +β 3 (8.6)
Rata-rata PDRB untuk wilayah 3 adalah:
E (Y i|D2i =1 D3 i =0)=β 1 (8.7)
Pengolahan data dengan Mintab mendapatkan hasil berikut:
¿
Y i=30472757+30582230 D2 i +199000000 D3 i
Se (25441836) (40671587) (44066553)
T (1,20) (0,75) (4,51)
Pvalue (0,241) (0,459) (0,00) R2 = 44,0%
Berdasarkan basil tersebut, ternyata ada perbedaan yang cukup signifikan pada jumlah
PDRB di wilayah 2, yaitu propinsi-propinsi di wilayah Jawa dan Bali dibandingkan
dengan wilayah lain di Indonesia. Hal ini dapat dilihat dari nilai T hitung (4,51) dari
parameter
β 3 yang cukup signifikan pada taraf α = 0.05 (P value = 0.00), namun tidak
demikian halnya dengan wilayah lainnya karena hasil uji nilaikoefisien β 1 dan β 2 tidak
signifikan, artinya antara wilayah 1 dan 3 tidak mempunyai perbedaan yang berarti dalam
hal PDRB.
Rata-rata jumlah PDRB dapat dengan mudah dilihat pada nilai kcefisien fJ dari masing-
30.472.757 juta rupiah dan β 2 nya adalah rata-rata PDRB di wilayah 1 sekitar 30.472.757
4
6. Sumatera Selatan 287,188 81,531,510.0 1 0
7, Bengkulu 49,509 10,134,450.50 1 0
8. Lampung 229,131 40,906,788.94 1 0
9. Kep. Bangka Belitung 39,340 14,171,629.63 1 0
10. OKI Jakarta 615,917 433,860,253.04 0 1
11. Jawa Barat 2,527.807 389,244,653.80 0 1
12. Jawa Tengah 1,446,40 234,435,323.34 0 1
13. DI Yogyakarta 93,5074 25,337,603.41 0 1
14. Jawa Timur 1,629,882 403,392,350.73 0 1
15. Banten 549,995 84,622,803.326 0 1
16. Bali 81,748 33,946,467.53 0 1
17. Nusa Tenqqara Barat 174.996 25,682,674.13 0 0
18. Nusa Tenggara Timur 117,821 14,810,472.10 0 0
19. Kalimantan Barat 171,724 33,869,468.05 0 0
20. Kalimantan Tengah 45,262 20,983,169.9B 0 0
21. Kalimantan Selatan 99.547 31,794,068.90 0 0
Propinsi Pengangguran PDRB 2005 Wilayah 1 Wilayah 2
(D2) (03)
22. Kalimantan Timur 111,180 180,289,090. 0 0
23. Sulawesi Utara 143,752 18,763,479.1
07 0 0
24. Sulawesi Tengah 78,145 17,116,580.90 0 0
73. Sulawesi Selatan 516,622 51,780,442.53 0 0
25. Sulawesi Tenggara 79,081 12,981,046.42 0 0
26. Gorontalo 37,993 3,480,566.617 0 0
27. Maluku 58,631 4,570,664.05 0 0
28. Maluku Utara 34,496 2,583,101.46 0 0
29. Papua 92,778 7,913,776.80 0 0
d. Nilai
β 1 atau intersepsi adalah nilai rata-rata dari variabeI kontrol. Pada contoh
5
sebelumnya, nilai sebesar +112.693 pada
β 2 berarti bahwa rata-rata jumlah
pengangguran pada wilayah 1 berbeda sebesar 112.693 orang dari variabel dasarnya,
yaitu wilayah 3.
f. Jika jumlah kategori pada variabel kualitatif !ebih dari satu, maka pemilihan variabel
kontrol diserahkan kepada peneliti dengan pertimbangan tertentu.
g. Ada cara yang mudah untuk menghindari kesalahan penentuan jumlah variabel dumi,
yaitu dengan membuat variabel dum! sejumlah kategorinya, namun dengan membuang
konstanta dari model. Misalnya, untuk contoh sebelumnya, modelnya akan menjadi
seperti berikut:
Y 2 =β 1 D1 i +β 2 D2i + β3 D 3i +ε i
Dengan:
β 1 = rata-rata PDRB di wilayah 1
6
T (21,95) (2,37) (-3.47)
Pvalue (0,065) (0,000) (0,241) R2 = 44,0%
Dengan:
Y = gaji per jam ($)
D2 = status perkawinan, 1 = menikah, 0 = lainnya
D3 = wilayah, 1 = Selatan, 0 = lainnya
Hal yang perlu diperhatikan di sini adalah kategori apakah yang menjadi kontrol. Pada
contoh ini, kategori yang menjadi kontrol adalah status tidak menikah dan tinggal di luar
wilayah selatan sehingga semua perbandingan didasarkan pada katagori tersebut. Nilai
β 1 = 8.8148 adalab rata-rata gaji per jam ($8.81) wanita dengan status tidak menikah dan
tidak tinggal di selatan, sedangkan rata-rata gaji per jam dari seorang wanita dengan
status menikah $1.10 lebih tinggi daripada wanita yang tidak menikah atau sebesar
$9.90. Sebaliknya, wanita yang tinggal di selatan akan mernpunyai gaji $1.7 lebih rendah
daripada gaji per jam rata-rata, yaitu $7.74. Hal yang hams diperhatikan adalah apabila
jumlah kategori dari masingmasing variabel kualitatifnya lebih dari dua.
Bagaimana jika dalam suatu model regresi variabel penjelasnya terdiri dari variabel
kualitatif dan kuantitaif? Analisis untuk model regresi dengan variabel penjelas
eampuran tersebut adalah analisis model kovariansi (analysis of covariance model
[ANCOVA]), yang merupakan bagian dari model ANOVA, yang efek dan variabeI
kuantitatifnya dikontrol secara statistik dan dinamakan sebagai covariate atau control
dalam beberapa perangkat lunak statistik.
Untuk mernudahkan pernahaman terhadap metode ANCOV A, kita akan mengguna kan
TABEL 8.2. Seandainya kita mernasukkan variabeljumlah pengangguran, maka model
yang terbentuk adalah sebagai berikut:
¿
Y i= β1 D1i + β 2 D2 i +β 3 D3i
Dengan:
Yi = PDRB pada wilayah ke-i
D2i = 1; wilayah 1
= 0; wilayah lainnya
D3i = I; wilayah 2
= 0; wilayah lainnya
Xi = jumlah pengangguran pada wilayah ke-i
7
Hasil pengolahan datanya adalah sebagai berikut:
¿
Y i=12105968+1436846 D2 i +72366689 D3 i +146 X i
Se (19250055) (30354303) (30354303)
T (0,63) (0,47) (1,73) (4,81 )
Pvalue (0,535) (0,645) (0,096) (0.000) R2 = 66,9%
Berdasarkan hasil tersebut, kita bisa melihat perubahan yang cukup rnengejutkan dari
hasil sebelurnnya. Setelah variabel bam dimasukkan, nilai R2 menuojukkan peningkatan yang
cukup berarti, dari 44% menjadi 66.9%, yang menunjukkan bahwa modelnya lebih baik
daripada model sebelumnya. Namun demikian, koefisien ()2 yang tadinya signifikan pada
model sebelumnya menjadi tidak signifikan pada taraf a = 0,05 (walaupun pada taraf a = 0,10
nilai koefisien tersebut signifikan). Selain itu, koefisien yang signifikan hanyalah 134,
menunjukkan bahwa faktor yang mempunyai pengaruh nyata terhadap peningkatan PDRB di
semua wilayah di Indonesia hanyalah peningkatanjumlah pengangguran.
Gambar 8.1 Plot regresi antara PDRB (Y) danjumlah pengangguran per wilayah (X)
Apabila dipisahkan berdasarkan wilayah, hasil modelnya terlihat pada Gambar 8.1,
yang menunjukkan babwa pengaruh PDRB yang temyata cukup signifikan pada jumlah
pengangguran terlihat jelas di wilayah 1 yang nilai R2-nya paling besar di antara yang lain.
8
Pemisahan model regresi per wilayah tersebut juga menunjukkan kondisi perekonomian
yang sangat berbeda dari ketiga wilayah, Hal yang rnenarik dari wilayah 1 dan 2 adalah
bahwa semakin tinggi jumlah pengangguran, semakin tinggi nilai PORB wilayah tersebut.
Sebaliknya, wilayah 3 tidak demikian, hubungan linear dari variabel tersebut tidak cukup
kuat karena nilai koefisien determinasinya (R2) sangat kecil (4,8%).
Penggunaan variabel dumi dapat dilakukan pada beberapa kondisi data. Selain kondisi
sebelumnya, variabel dumi juga dapat diterapkan, misalnya, dalam data-data seri yang
musiman, dengan variabel durui tersendiri yang diberikan pada setiap peri ode musim dan
dalarn pernbedaan kondisi variabel penjeJas yang berbeda, misalnya golongan umur dan
sebagainya. Pengembangan metode regresi dengan variabel durni saat ini mengarah pada
metode regresi nonparametrik, misalnya metode regresi spline.