Anda di halaman 1dari 16

PENYELESAIAN MULTIKOLINEARITAS DENGAN METODE STEPWISE REGRESSION PADA DATA PENJUALAN KAOS DISTRO PLANET GAYA

MAKALAH Untuk memenuhi tugas matakuliah Analisis Regresi yang dibina oleh Ir. Hendro Permadi, M.Si

Oleh: Kelompok I Wida Rekno A Siti Muyasaroh Rizqi Tri R Anisak Heritin Krisna Trenggalih 409312417668 409312417669 409312417683

JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MALANG November 2011

BAB I PENDAHULUAN

1.1 LATAR BELAKANG Seiring dengan perkembangan zaman permasalahan yang dihadapi manusia semakin kompleks. Begitu juga dengan suatu perusahaan yang terus ingin berkembang dalam meningkatkan kualitas produksi, pelayanan, dan tentunya pendapatan perusahaan. Perusahaan yang ingin maju harus bisa mengambil langkah-langkah yang tepat dan tanggap dalam membaca peluang pasar. Seperti meningkatkan promosi-promosi ke berbagai daerah dalam mempublikasikan hasil produksi, pembukaan outlet-outlet baru, analisis pasar dan pesaing yang baik, analisis pendapatan penduduk di sekitar daerah promosi, dan masih banyak lagi langkah-langkah yang bisa diambil. Untuk itulah diperlukan kajian yang membahas tentang analisis variabel-variabel yang mungkin berpengaruh dalam penjualan hasil produksi seperti yang akan dibahas nanti, yaitu kasus yang terjadi pada Distro Planet Gaya.Distro Planet Gayadalam beberapa bulan gencar mempromosikan sejumlah kaos dengan membuka outlet-outlet di 15 daerah di Lamongan. Mereka ingin mengetahui besar hubungan atau seberapa jauh biaya promosi, luas outlet, laju pertambahan penduduk, kompetitor atau pesaing, dan income penduduk berpengaruh terhadap penjualan Distro Planet Gaya. Oleh karena itu diperlukan uji regresi berganda, yang dalam hal ini melibatkan lebih dari dua variabel bebas, dengan variabel dependen adalah penjualan dan variabel independen adalah biaya promosi, luas outlet, laju pertambahan penduduk, kompetitor atau pesaing, dan income penduduk. Dalam hal ini akan digunakan Stepwise Regression untuk mengetahui variabel mana saja yang paling berpengaruh.

1.2 PERUMUSAN MASALAH Berdasarkan latar belakang masalah, maka dapat diambil rumusan masalah sebagai berikut: 1. Bagaimana cara mengidentifikasi adanya multikolinearitas? 2. Bagaimana cara mengatasi multikolinearitas dengan metode Stepwise Regression? 3. Bagaimana model terbaik dari data yang telah dianalisis?

1.3 TUJUAN PENULISAN Berdasarkan rumusan masalah tersebut, maka tujuan penulisan makalah adalah sebagai berikut: 1. Mengetahui cara mengidentifikasi adanya multikolinearitas. 2. Mengetahui cara mengatasi multokolinearitas dengan metode Stepwise Regression. 3. Mengetahui model terbaik dari data yang dianalisis.

1.4 MANFAAT Dengan ditulisnya makalah ini Distro Planet Gaya setidaknya mendapatkan masukan dalam mempertimbangkan langkah-langkah yang mungkin bisa diambil dalam melakukan penjualan ke 15 daerah di Lamongan. Selain itu kita sebagai pembaca mungkin bisa mendapatkan pengetahuan tentang bagaimana penggunaan Stepwise Regression dalam analisis regresi berganda, terutama untuk regresi yang melibatkan lebih dari dua variabel bebas.

BAB II KAJIAN TEORI Metode Stepwise adalah salah satu metode yang sering dipakai dalam analisis regresi. Metode ini hampir sama dengan Forward, hanya di sini variabel yang telah dimasukkan dalam model regresi bisa dikeluarkan lagi dari model. Metode ini dimulai dengan memasukkan variabel bebas yang mempunyai korelasi paling kuat dengan variabel dependen. Kemudian setiap kali pemasukan variabel bebas yang lain, dilakukan pengujian untuk tetap memasukkan variabel bebas atau mengeluarkannya. Salah satu program komputer yang bisa digunakan adalah SPSS dan Minitab. Dalam hal ini SPSS dan Minitab menyediakan berbagai metode perhitungan persamaan regresi berganda dengan banyak variabel, seperti Backward Elimination, Forward Elimination, dan Stepwise Method. Ketiga metode itu pada akhirnya akan menghasilkan output model yang sama, hanya prosesnya saja yang berbeda.

2.1 Analisis Regresi Linear Berganda Analisis regresi linier berganda merupakan bentuk umum, sedangkan regresi linier sederhana merupakan bentuk khusus dari regresi linier berganda yaitu regresi yang melibatkan satu peubah bebas. Dengan regresi linier berganda persamaan dalam X memberikan prediksi yang terbaik terhadap Y. Model regresi linier berbentuk Y=0+ 1X1+ 2X2++kXk+ Dengan Xi, i = 1,2,,k merupakan peubah bebas dan i, i=1,2,,k parameter regresi, dan sebagai error. Dan sebarang model yang tidak berbentuk seperti persamaan di atas disebut model tak linier. Jika pada suatu model regresi tersebut terdapat satu peubah bebas , maka model itu disebut regresi linier sederhana. Sedangkan jika terdapat lebih dari satu peubah bebas, maka model itu disebut regresi linier berganda. Dalam melakukan analisis harus diperhatikan beberapa asumsi yang mendasarinya: 1. Nilai harapan bersyarat galat yang disebabkan oleh peubah bebas X yang harus sama dengan nol. 2. Setiap galat yang disebabkan peubah bebas mempunyai varian yang sama. 3. Tidak ada multikolinieritas yang berarti tidak ada hubungan linier antara peubah bebas.

Drapper n Smith (1992), menyatakan beberapa kriteria yang digunakan untuk melihat tepat tidaknya model regresi yang diperoleh, salah satunya yaitu dengan melihat koefisien determinasi berganda (Rk2). Sebuah masalah penting dalam penerapan analisis regresi linier berganda adalah pemilihan peubah peubah bebas yang dapat digunakan dalam model agar diperoleh persamaan regresi terbaik yang mengandung sebagian atau seluruh peubah bebas.

2.2 Multikolinearitas Multikolinearitas ditemukan oleh Ragner Frisch yang berarti adanya hubungan linier yang sempurna atau pasti diantara beberapa atau semua variabel yang menjelaskan (X 1, X2,,Xk) dari model regresi. Akibat terjadinya multikolinearitas antara lain: 1) Nilai koefisien regresi berganda biasa. 2) Terjadi perubahan tanda pada koefisien regresi berganda seharusnya positif menjadi negatif.

Untuk mendeteksi adanya multikolinearitas digunakan beberapa metode yaitu: 1) Koefisien korelasi antara peubah bebas. Adanya multikolinearitas seringkali diduga apabila nilai R2 cukup besar . 2) Dengan melihat elemen matrik korelasi. Jika korelasi antarvariabel independen lebih besar daripada korelasi antara variabel independen dan variabel dependennya menandakan adanya multikolinearitas pada variabel independennya. 3) VIF (Variance Inflation Factor ) Jika nilai VIF lebih dari 10 menandakan adanya multikolinearitas pada variabel bebas.

BAB III PEMBAHASAN

3.1 KASUS Distro Planet Gaya dalam beberapa bulan gencar mempromosikan sejumlah kaos dengan membuka outlet-outlet di berbagai daerah di Lamongan. Distro tersebut ingin mengetahui besar hubungan atau seberapa jauh biaya promosi, luas outlet, laju pertambahan penduduk, kompetitor atau pesaing, dan income penduduk berpengaruh terhadap penjualan Distro Planet Gaya. Oleh karena akan dilakukan uji regresi dengan keterangan sebagai berikut. 1. Variabel bergantung/dependen (Y) : penjualan. 2. Variabel bebas/independen: a) X1: Biaya Promosi (dalam juta Rupiah) b) X2: Luas Outlet (dalam m2) c) X3: Laju Pertambahan Penduduk d) X4: Kompetitor atau Pesaing e) X5: Income Penduduk 3.2 DATA YANG DIGUNAKAN Daerah Penjual an (Y) 200 201 249 241 196 286 229 204 199 211 240 281 307 259 317 Promosi (X1) 21 23 30 26 16 44 25 25 19 26 27 42 49 35 37 Luas Outlet (X2) 154 159 193 179 145 203 179 149 144 170 187 196 243 161 282 Laju Penduduk (X3) 1.50 1.00 1.25 1.14 2.15 0.95 1.17 2.24 0.85 1.63 2.14 1.13 2.03 2.04 1.03 Pesaing (X4) 10 11 14 12 6 19 11 5 9 9 6 14 16 13 13 Income (X5) 4.96 1.93 2.06 3.05 3.85 3.15 2.94 2.05 4.29 2.03 2.25 2.03 3.01 2.31 2.51

LAMONGAN MADURAN MANTUP BABAT SUKODADI SUGIO PACIRAN SEKARAN TIKUNG KARANGGENENG KARANGBINAGUN DEKET PUCUK KEMBANGBAHU TURI

3.3 MENGANALISIS ADANYA MULTIKOLINEARITAS Persamaan regresi yang diperoleh dengan memasukkan seluruh variable independen adalah y = 64.7 + 2.03 x1 + 0.552 x2 + 2.44 x3 + 0.91 x4 + 0.61 x5 Perhatikan hasil dari Minitab berikut: Correlations: y, x1, x2, x3, x4, x5 y x1 x1 0.916 0.000 x2 x3 x4

x2 0.903 0.735 0.000 0.002 x3 -0.145 -0.062 -0.199 0.605 0.827 0.477 x4 0.744 0.796 0.574 -0.495 0.001 0.000 0.025 0.060 x5 -0.287 -0.339 -0.252 -0.111 -0.073 0.300 0.217 0.366 0.694 0.795

Cell Contents: Pearson correlation P-Value

Dari hasil tersebut dapat kita lihat bahwa terdapat perbedaan tanda antara koefisien x 3 dan x5 pada persamaan regresi dengan hasil perhitungan korelasi Pearson. Oleh karena itu dapat kita simpulkan bahwa terdapat multikolinearitas di antara beberapa variabel independen, baik dengan sesama variabel independen maupun dengan variable dependen.

3.4 MENGATASI MULTIKOLINEARITAS DENGAN MENGGUNAKAN STEPWISE REGRESSION Metode Stepwise dimulai dengan memasukkan variabel bebas yang mempunyai korelasi paling kuat dengan variabel dependen. Kemudian setiap kali pemasukan variabel bebas yang lain, dilakukan pengujian untuk tetap memasukkan variabel bebas atau mengeluarkannya. Dari hasil analisis korelasi kita tahu bahwa variabel bebas yang mempunyai korelasi paling kuat dengan variabel dependen adalah variabel Promosi, Outlet, dan Pesaing karena nilai korelasi dengan variabel dependen masing-masing variabel tersebut di atas 0,5.

1) Stepwise Regression (Memasukkan x1)

Stepwise Regression: y versus x1 Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15

Response is y on 1 predictors, with N = 15

Step Constant

1 126.0

x1 3.89 T-Value 8.21 P-Value 0.000 S 17.1 R-Sq 83.84 R-Sq(adj) 82.60 Mallows C-p 2.0

Regression Analysis The regression equation is y = 126 + 3.89 x1

Predictor Coef SE Coef T P Constant 126.03 14.72 8.56 0.000 x1 3.8866 0.4733 8.21 0.000

S = 17.1385 R-Sq = 83.8% R-Sq(adj) = 82.6%

Analysis of Variance Source DF SS MS F P Regression 1 19809 19809 67.44 0.000 Residual Error 13 3818 294 Total 14 23627

ANALISIS: F hitung >F tabel= 4.66719 ; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti T hitung>T tabel= 1.77093 ;artinya tolak H0. Dapat disimpulkan bahwa variabel Promosi berpengaruh terhadap Penjualan.

Stepwise Regression (Memasukkan x2) Stepwise Regression: y versus x1, x2 Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15

Response is y on 2 predictors, with N = 15

Step Constant

1 2 126.03 73.69

x1 3.89 2.33 T-Value 8.21 5.94 P-Value 0.000 0.000

x2 T-Value P-Value

0.539 5.42 0.000

S 17.1 9.61 R-Sq 83.84 95.31 R-Sq(adj) 82.60 94.53 Mallows C-p 30.4 3.0

Regression Analysis: y versus x1, x2 The regression equation is y = 73.7 + 2.33 x1 + 0.539 x2

Predictor Coef SE Coef T P Constant 73.69 12.70 5.80 0.000 x1 2.3266 0.3914 5.94 0.000 x2 0.53911 0.09946 5.42 0.000

S = 9.60631 R-Sq = 95.3% R-Sq(adj) = 94.5%

Analysis of Variance Source DF SS MS F P Regression 2 22520 11260 122.02 0.000 Residual Error 12 1107 92 Total 14 23627

Source DF Seq SS x1 1 19809 x2 1 2711

ANALISIS: F hitung >F tabel= 4.66719; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti T hitung>T tabel= 1.77093;artinya tolak H0. Dapat disimpulkan bahwa variabel Promosi dan Outlet berpengaruh secara serentak terhadap Penjualan.

Stepwise Regression(Memasukkan x4)

Stepwise Regression: y versus x1, x2, x4 Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15

Response is y on 3 predictors, with N = 15

Step Constant

1 2 126.03 73.69

x1 3.89 2.33 T-Value 8.21 5.94 P-Value 0.000 0.000 x2 T-Value P-Value 0.539 5.42 0.000

S 17.1 9.61 R-Sq 83.84 95.31 R-Sq(adj) 82.60 94.53 Mallows C-p 27.9 2.3

Regression Analysis: y versus x1, x2, x4 The regression equation is y = 72.5 + 2.13 x1 + 0.541 x2 + 0.60 x4

Predictor Coef SE Coef T P Constant 72.51 13.29 5.45 0.000 x1 2.1321 0.5462 3.90 0.002 x2 0.5406 0.1026 5.27 0.000 x4 0.597 1.128 0.53 0.608

S = 9.90837 R-Sq = 95.4% R-Sq(adj) = 94.2%

Analysis of Variance Source DF SS MS F P Regression 3 22547.4 7515.8 76.55 0.000 Residual Error 11 1079.9 98.2 Total 14 23627.3

Source DF Seq SS x1 1 19808.9 x2 1 2711.1 x4 1 27.4

ANALISIS: F hitung >F tabel= 4.66719; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti. Akan tetapi T hitung<T tabel=1,77093 di variabel Pesaing;artinya menerima H0. Dapat disimpulkan bahwa variabel Pesaing kurang berpengaruh terhadap Penjualan, sehingga kita perlu untuk membuang variabel Pesaing.

Menurut keterangan Collinearity Statistics dari SPSS, yaitu dengan memperhatikan kolom TOLERANCE atau toleransi.

a Coeffici ents

Model 1

(Constant) X1

Unstandardized Coef f icients B Std. Error 126.030 14.721 3.887 .473

Standardi zed Coef f icien ts Beta .916

t 8.561 8.212

Sig. .000 .000

Collinearity Statistics Tolerance VIF 1.000 1.000

a. Dependent Variable: Y

a Coeffici ents

Model 1

(Constant) X1 X2

Unstandardized Coef f icients B Std. Error 73.690 12.702 2.327 .391 .539 .099

Standardi zed Coef f icien ts Beta .548 .500

t 5.802 5.944 5.420

Sig. .000 .000 .000

Collinearity Statistics Tolerance VIF .459 .459 2.177 2.177

a. Dependent Variable: Y

Sebagai contoh pada model ke 2 untuk variabel X1(Promosi), didapat besar toleransi adalah 0,459. Hal ini berarti R2 adalah 1 0,459 atau 0,541. Hal ini berarti hanya 54,1 % variabilitas promosi bisa dijelaskan oleh prediktor (variabel bebas) yang lain. Default bagi SPSS bagi angka toleransi adalah 0,0001. Semua variabel yang akan dimasukkan dalam perhitungan model regresi harus mempunyai toleransi di atas 0,0001. Terlihat bahwa semua variabel telah memenuhi persyaratan ambang toleransi. Perhatikan kolom VIF !Sebagai contoh, pada model ke 2 untuk variabel X1(promosi), didapat besar toleransi 0,459. Maka besar VIF adalah: VIF = 1 / 0,459 = 2,177 Pada umumnya, jika VIF lebih dari 10, maka variabel tersebut mempunyai persoalan multikolinieritas dengan variabel bebas yang lainnya. Jika dilihat pada tabel diatas, maka variabel bebas Outlet(X2) dan Promosi(X1) mempunyai VIF kurang dari 10, sehingga bisa diduga tidak ada persoalan multikolinieritas yang serius.

Ada tidaknya multikolinearitas di antara sesama variabel bebas dapat dilihat sebagai berikut.
a Colli neari ty Diagnostics

Model 1

Dimension 1 2

Eigenv alue 1.954 4.625E-02

Condit ion Index 1.000 6.500

Variance Proportions (Constant) X1 .02 .02 .98 .98

a. Dependent Variable: Y

a Colli nearity Di agnostics

Model 1

Dimension 1 2 3

Eigenv alue 2.942 4.628E-02 1.185E-02

Condition Index 1.000 7.973 15.754

Variance Proportions (Constant) X1 X2 .00 .00 .00 .40 .46 .00 .60 .53 1.00

a. Dependent Variable: Y

Bagian ini membahas ada tidaknya multikolinearitas atau terjadinya korelasi di antara sesama variabel bebas. Model regresi yang baik tentunya tidak ada multikolinier atau adanya korelasi diantara variabel bebas. Promosi dan Outlet (kode 2 dan 3) mempunyai nilai Eugen yang mendekati 0. Sedangkan indeks variabel Outlet melebihi angka 15. Hal ini berarti ada dugaan terjadi problem multikolinieritas, yaitu adanya korelasi diantara variabel Promosi dan Outlet. Hal ini mengindikasikan bahwa Stepwise Regression tidak menjamin untuk bisa menyelesaikan persoalan multikolinearitas.

BAB IV KESIMPULAN Hanya ada dua variabel bebas yang dimasukkan dalam model regresi, yaitu Promosi dan Outlet. Sedangkan persamaan regresi yang didapat adalah: y = 73.7 + 2.33 x1 + 0.539 x2 Dimana: Y = Penjualan, sedang X1= Biaya Promosi, dan X2 = Luas Outlet.

DAFTAR PUSTAKA

Anonim, Apa Itu Regresi Stepwise. http. analisis regresi/anreg/Apa itu Regresi Stepwise Professional Data Analyst.htm.Diakses pada tanggal 20-11-2011 Anonim,Kolineritas Berganda. Http. Kolinearitas Ganda (multicollinearity) Excellent88's Blog.htm.Diakses pada tanggal 21-11-2011