Anda di halaman 1dari 14

PENYELESAIAN KASUS MULTIKOLINEARITAS PADA DATA PENJUALAN PERALATAN ELEKTRONIK DENGAN METODE BEST SUBSET REGRESSION

MAKALAH Disusun untuk memenuhi tugas mata kuliah Analisis Regresi yang dibina oleh Ir. Hendro Permadi, M.Si

Oleh Anita Hermaningtyas Rina Uktafiya Umi Qoiriah 408312408019 408312409119 408312409125

Dwi Rahmawati Utami 40831240913

UNIVERSITAS NEGERI MALANG FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI MATEMATIKA Desember 2010

BAB 1 PENDAHULUAN

A. Latar Belakang Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan suatu variabel terhadap variabel yang lain. Variabel yang pertama disebut dengan variabel bebas atau variabel karena seringkali digambarkan

dalam grafik sebagai absis. Variabel yang kedua adalah variabel terikat atau variabel , dalam grafik digambarkan sebagai ordinat. Kedua variabel ini biasanya merupakan variabel acak (random). Apabila kita menggunakan model regresi , dalam hal ini kita mempunyai asumsi bahwa , , , , sebagai

variable-variabel bebas tidak berkorelasi satu sama lain. Seandainya variablevariabel bebas tersebut berkorelasi satu sama lain, maka dikatakan terjadi kolinearitas berganda (multicollinearity). Ada kemungkinan terjadi 2 variabel atau lebih mempunyai hubungan yang sangat kuat sehingga pengaruh masing-masing variable tersebut terhadap sukar untuk dibedakan (Supranto, 2001).

Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi yang tinggi antara masing-masing variabel independen dalam model regresi. Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang digunakan saling terkait dalam suatu model regresi. Oleh karena itu masalah multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya melibatkan satu variabel independen. Best subset adalah suatu metode pemilihan variable X yang memuat hubungan terbaik dengan variable Y. Menaksir persamaan regresi semua kemungkinan menggunakan semua kemungkinan kombinasi dari variabel independen. Pilih terbaik sesuai dengan mencari disesuaikan tertinggi di R 2 dan standart error terendah.

B. Rumusan Masalah 1. Bagaimana mengidentifikasi multikolinearitas? 2. Bagaimana cara mengatasi multikolinearitas? 3. Bagaimana aplikasi dari metode best subset?

C. Tujuan 1. Untuk mengetahui mengidentifikasi multikolinearitas. 2. Untuk mengetahui cara mengatasi multikolinearitas. 3. Untuk mengetahui aplikasi dari metode best subset.

BAB II PEMBAHASAN

Dalam suatu penelitian ilmiah biasanya yang diteliti adalah hubungan antara peubah, dimana perubah itu sebut saja hubungan antara peubah, dimana peubah itu sebut saja peubah bebas dan peubah tak bebas . Hubungan tersebut

dapat pula berupa hubungan fungsional antar peubah yang satu dengan peubah yang lain. Tetapi masing-masing peubah merupakan bilangan random, sehingga bilamana peubah dipengaruhi atau ditentukan besarnya oleh peubah maka

dapat dikatakan bahwa permasalahan tersebut dapat diselesaikan dengan menggunakan teknik analisis regresi (Nugroho, 1990b). Dalam penelitian ini analisis yang dipergunakan adalah Analisis Regresi Berganda. Menurut Nugroho (1990b) ada beberapa alas an dipergunakan Regresi Berganda : a. Membuat persamaan di dalam yang memberikan prediksi yang terbaik

terhadap . Dengan adanya banyak peubah , mungkin juga termasuk di dalamnya pemilihan subset yang terbaik untuk memprediksi . b. Dengan mengetahuinya peubah-peubah yang berpengaruh terhadap , mungkin perlu membuat rangking yang didasarkan pada besarnya pengaruh terhadap .

Analisis Regresi Linier Berganda merupakan bentuk umum sedangkan Regresi Linier Sederhana merupakan bentuk khusus dari Regresi Linier Berganda yaitu apabila satu peubah bebas yang dilibatkannya (Yitnosumartono, 1988)

Dalam regresi linier berganda terdapat satu peubah tak bebas yang akan dilihat hubungannya dengan dua atau lebih peubah bebasnya, umpakan bahwa pengamatan-pengamatan beberapa , , , ..., dapat dinyatakan dengan fungsi-fungsi linier dari yang diketahui dan faktor sisa. Model populasinya

adalah sebagai berikut: ................................... 5.8

I = 1, 2, 3, ..., Dimana , ..., , ..., = Nilai pengamatan yang ke= peubah bebas yang menentukan nilai pengamatan ke= koefisien-koefisien regresi sebagian (parsial) untuk peubah , ..., , secara berturut-turut.

= titik potong sumbu = faktor sisaan yang ke= banyaknya pengamatan

Berdasarkan dari matriks korelasi kita dapat mengetahui gambaran kolinearitas ganda antara peubah bebas secara kasar dengan jalan menggunakan metode membanding koefisien korelasi dalam matriks korelasi dengan nilai kritis pada taraf nyata . Dari koefisien yang terpilih lalu dihitung korelasi parsialnya setelah itu langsung dilakukan pengujian hipotesis dimana :

Adapun statistik uji yang digunakan adalah : dimana : = banyaknya pengamatan = banyaknya peubah bebas Bila mana benar maka mengikuti distribusi dengan derajat bebas
( )

pada taraf nyata , jika kolinearitas ganda disebabkan karena dalam regresi.

maka

ditolak yang berarti

dan

terjadi secara bersama-sama

Multikolinieritas (kolinearitas ganda) ditemukan oleh Ragner Frisch yang berarti adanya hubungan linier yang sempurna atau pasti diantara beberapa atau semua variabel yang menjelaskan ( , , ..., ) dari model regresi.

Beberapa cara mengetahui apakah suatu model regresi itu mempunyai kolinearitas ganda atau tidak adalah sebagai berikut:

a. Suatu model yang variable-variabel penjelasnya bersifat kolinearitas memperlhatkan tanda-tanda sebagai berikut: 1. Koefisien determinasi ganda tinggi

2. Koefisien korelasi sederhananya tinggi 3. VIF (Variance Inflation Factor ) Jika nilai VIF lebih besar atau sama dengan 10, menandakan adanya multikolinieritas pada variabel bebas. 4. Tak satupun (sedikit sekali diantaranya) variable-variabel bebas memiliki uji- yang signifikan, walaupun keadaan 1, 2 dan 3 terpenuhi. b. Jika hanya ada dua variable bebas yang ternyata korelasi antara kedua variable itu tinggi, maka dapat merupakan indikasi bahwa dalam model tersebut terjadi kolinearitas. Akan tetapi apabila model itu mempunyai lebih dari dua variable bebas, walaupun korelasi antara dua variable rendah, tidak dapat menjadi jaminan bahwa model tersebut tida bersifat multikollinearitas. c. Apabila model yang akan diuji adalah: ( ) dengan mendekati 1,

koefisien determinasi gandanya adalah tinggi yakni: akan tetapi , ,

mempunyai nilai yang sangat rendah dengan


, , dan

dibandingkan nilai kofisien determinasi ganda antara berarti ada kolinearitas ganda. d. Mengadakan uji

antara variable-variabel bebasnya. Jika

hitung

dibandingkan dengan

tabel dan ternyata signifikan maka dapat dianggap

bahwa ada multikolinearitas (Awat, 1995). Akibat Adanya Kolinearitas Ganda

Jika hubungan antar variable bebasnya sempurna, maka koefisien regresi parsial tak akan dapat diestimasi.

Kalau hubungan tersebut tidak sempurna, maka koefisien regresi parsial masih bisa diestimasi, tetapi kesalahan baku dari penduga koefisien regresi parsial sangat besar. Hal ini menyebabkan pendugaan/peramalan nilai kurang teliti.

Cara Mengatasi Masalah Kolinearitas Ganda

Memeriksa secara teoritis untuk mengetahui apakah antara variable bebas memang ada hubungannya.

Mengadakan penggabungan antara data cross-section dan time series, yang akan disebut sebagai polling data.

Mengeluarkan salah satu variable bebasnya dari model tersebut. Mentransformasi variable yang ada dalam model. Menambah data baru, yakni menambah jumlah observasi atau . Dengan semakin besarnya , maka ada kemungkinan bahwa standard error akan semakin kecil pula.

Best Subset Regression Regresi terbaik(best subsets regression) digunakan untuk meregresikan satu peubah respon pada semua kemungkinan kombinasi subset peubah-peubah prediktor dan kemudian memilih subset terbaik untuk setiap ukuran (size) informasi model terbaik ini dipilih berdasarkan nilai R-square terbesar. Pada setiap regresi subset terbaik ditampilkan statistik, yaitu : R-sq, adj R-sq, S dan Cp. Jika model di fit tanpa konstanta, R-sq dan adj R-sq tidak ditampilkan.

APLIKASI P.T. Cemerlang dalam beberapa bulan gencar mempromosikan sejumlah peralatan elektronik dengan membuka outlet-outlet di berbagai daerah. Berikut adalah data mengenai kenaikan penjualan, biaya promosi, jumlah outlet, laju penduduk, jumlah pesaing dan income masyarakat pada bulan Mei 2010. Kenaikan Income Banyaknya Biaya Promosi Outlet Pesaing Laju Penduduk (%) 205 206 254 246 201 291 234 209 204 216 245 286 312 265 322 26 28 35 31 21 49 30 30 24 31 32 47 54 40 42 159 164 198 184 150 208 184 154 149 175 192 201 248 166 287 15,00 16,00 19,00 17,00 11,00 24,00 16,00 10,00 1,35 2,13 2,64 1,63 2,53 2,54 1,53 2,00 1,50 1,75 1,64 2,65 1,45 1,67 2,74 14,00 14,00 11,00 19,00 21,00 18,00 18,00

Penjualan Masyarakat Sales (%) 10 12 30 25 8 38 21 14 9 17 24 48 55 35 60 (%) 5,46 2,43 2,56 3,55 4,35 3,65 3,44 2,55 4,79 2,53 2,75 2,53 3,51 2,81 3,01

Keterangan : = Kenaikan penjualan = Income masyarakat = Banyaknya sales = Biaya Promosi = Outlet = Pesaing = Laju penduduk

Dari hasil minitab yang didapat untuk mencari best subset dicari C-P dengan nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.

Sedangkan,

Dari data di atas dapat dilihat bahwa pada regresi dan korelasinya ada perubahan tanda sehingga menunjukkan bahwa data tersebut multikolinearitas. Lalu kita mulai menggunakan metode best subset yaitu dicari C-P dengan nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.

Dari keterangan di atas dapat dilihat R-sq yang besar dengan C-p dan S terkecil adalah persamaan dengan variable , , , , , .

Menganalisis dengan melihat nilai C-p bukan terkecil, Sterkecil, dan R-Sq (Adj)

Dapat dilihat bahwa pada persamaan regresi tersebut masih terdapat perubahan tanda sehingga masih terdapat kasus multikolinieritas sehingga persamaan regresi tersebut juga masih mengandung kasus multikolinieritas. Oleh karena itu, kita cari persamaan regresi yang lebih baik dengan C-p terkecil selanjutnya dan beda R-sq yang tidak jauh dari R-sq yang terbesar sehigga diperoleh persamaan regresi terbaik. Selanjutnya dipilih variable dan R-Sq (Adj ) terbesar. , , dan karena memiliki C-p dan s terkecil

Berdasarkan hasil regresi di atas dapat dilihat bahwa masih terjadi perubahan tanda pada persaman regresinya..Sehingga masih terjadi kasus multikolineariatas.Oleh karena itu perlu dipilih kemungkinan variable yang lain dengan 2 variabel yang merupakan variable terbaik. Berikut ini analisis regresi dari dengan variabel bebas dan dengan C-

p terkecil namun bukan terkecil dan R-Sq(Adj) bukan terbesar. Lalu diregresikan :

Dari analisis di atas, nampak bahwa pada persamaan regresi sudah tidak terjadi perubahan tanda lagi. Serta VIF dari kedua variabel tersebut keduanya kurang dari 5. Sehingga dapat disimpulkan bahwa variabel yang paling berpengaruh terhadap yaitu dan sehingga model regresi yang terbaik yaitu dengan R-sq = selisihnya tidak jauh dari R-sq yang terbesar. dan R-sq(adj) = yang

BAB III KESIMPULAN

Berdasarkan pembahasan data di atas dapat disimpulkan bahwa: 1. Dari data penelitian kenaikan penjualan peralatan elektronik pada PT Cemerlang, ternyata terjadi kasus multikolinieritas. Maka untuk mengatasinya digunakan metode best subset regression. 2. Dari hasil analis menggunakan metode best subset regression diperoleh 2 variable yang paling mempengaruhi kenaikan penjualan peralatan elektronik, yaitu banyaknya sales dan benyaknya pesaing. 3. Dengan menggunakan metode best subset regression diperoleh model regresi terbaik yaitu dengan nilai C-P = 1,6 merupakan nilai paling kecil, nilai bukan terkecil, nilai R-Sq (Adj) = regresi , dengan persamaan

4. Dari kesimpulan 1, 2, 3 dapat disimpulkan bahwa semakin banyak sales dan sedikit pesainga, semakin tinggi kenaikan penjualan peralatan elektronik.

DAFTAR PUSTAKA Permadi, Hendro. 1999. Teknik Analisis Regresi. UM Press: Jakarta. http://myunanto.staff.gunadarma.ac.id/Downloads/files/19417/BAB+15+REGRE SI+TIP+TRIK+BERBAGAI+METODE+REGRESI+BERGANDA.pdf