Anda di halaman 1dari 16

PENYELESAIAN MULTIKOLINEARITAS DENGAN METODE STEPWISE REGRESSION PADA DATA PENJUALAN

KAOS DISTRO “PLANET GAYA”

MAKALAH

Untuk memenuhi tugas matakuliah Analisis Regresi yang dibina oleh Ir. Hendro Permadi, M.Si

Oleh:

Kelompok I

Wida Rekno A Siti Muyasaroh

409312417668

Rizqi Tri R

409312417669

Anisak Heritin Krisna Trenggalih

409312417683

PENYELESAIAN MULTIKOLINEARITAS DENGAN METODE STEPWISE REGRESSION PADA DATA PENJUALAN KAOS DISTRO “PLANET GAYA” MAKALAH Untuk memenuhi

JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MALANG November 2011

BAB I PENDAHULUAN

1.1 LATAR BELAKANG Seiring dengan perkembangan zaman permasalahan yang dihadapi manusia semakin kompleks. Begitu juga dengan suatu perusahaan yang terus ingin berkembang dalam meningkatkan kualitas produksi, pelayanan, dan tentunya pendapatan perusahaan. Perusahaan yang ingin maju harus bisa mengambil langkah-langkah yang tepat dan tanggap dalam membaca peluang pasar. Seperti meningkatkan promosi-promosi ke berbagai daerah dalam mempublikasikan hasil produksi, pembukaan outlet-outlet baru, analisis pasar dan pesaing yang baik, analisis pendapatan penduduk di sekitar daerah promosi, dan masih banyak lagi langkah-langkah yang bisa diambil. Untuk itulah diperlukan kajian yang

membahas tentang analisis variabel-variabel yang mungkin berpengaruh dalam penjualan hasil produksi seperti yang akan dibahas nanti, yaitu kasus yang terjadi pada Distro “Planet Gaya”.Distro “Planet Gaya”dalam beberapa bulan gencar mempromosikan sejumlah kaos

dengan membuka outlet-outlet di 15 daerah di Lamongan. Mereka ingin mengetahui besar hubungan atau seberapa jauh biaya promosi, luas outlet, laju pertambahan penduduk, kompetitor atau pesaing, dan income penduduk berpengaruh terhadap penjualan Distro

“Planet Gaya”. Oleh karena itu diperlukan uji regresi berganda, yang dalam hal ini

melibatkan lebih dari dua variabel bebas, dengan variabel dependen adalah penjualan dan variabel independen adalah biaya promosi, luas outlet, laju pertambahan penduduk, kompetitor atau pesaing, dan income penduduk. Dalam hal ini akan digunakan Stepwise Regression untuk mengetahui variabel mana saja yang paling berpengaruh.

  • 1.2 PERUMUSAN MASALAH Berdasarkan latar belakang masalah, maka dapat diambil rumusan masalah sebagai berikut:

    • 1. Bagaimana cara mengidentifikasi adanya multikolinearitas?

    • 2. Bagaimana cara mengatasi multikolinearitas dengan metode Stepwise Regression?

    • 3. Bagaimana model terbaik dari data yang telah dianalisis?

  • 1.3 TUJUAN PENULISAN Berdasarkan rumusan masalah tersebut, maka tujuan penulisan makalah adalah sebagai berikut:

    • 1. Mengetahui cara mengidentifikasi adanya multikolinearitas.

    • 2. Mengetahui cara mengatasi multokolinearitas dengan metode Stepwise Regression.

    • 3. Mengetahui model terbaik dari data yang dianalisis.

  • 1.4 MANFAAT

  • Dengan ditulisnya makalah ini Distro “Planet Gaya” setidaknya mendapatkan masukan

    dalam mempertimbangkan langkah-langkah yang mungkin bisa diambil dalam melakukan penjualan ke 15 daerah di Lamongan. Selain itu kita sebagai pembaca mungkin bisa

    mendapatkan pengetahuan tentang bagaimana penggunaan Stepwise Regression dalam analisis regresi berganda, terutama untuk regresi yang melibatkan lebih dari dua variabel bebas.

    BAB II KAJIAN TEORI Metode Stepwise adalah salah satu metode yang sering dipakai dalam analisis regresi. Metode ini hampir sama dengan Forward, hanya di sini variabel yang telah dimasukkan dalam model regresi bisa dikeluarkan lagi dari model. Metode ini dimulai dengan memasukkan variabel bebas yang mempunyai korelasi paling kuat dengan variabel dependen. Kemudian setiap kali pemasukan variabel bebas yang lain, dilakukan pengujian untuk tetap memasukkan variabel bebas atau mengeluarkannya. Salah satu program komputer yang bisa digunakan adalah SPSS dan Minitab. Dalam hal ini SPSS dan Minitab menyediakan berbagai metode perhitungan persamaan regresi berganda dengan banyak variabel, seperti Backward Elimination, Forward Elimination, dan Stepwise Method. Ketiga metode itu pada akhirnya akan menghasilkan output model yang sama, hanya prosesnya saja yang berbeda.

    • 2.1 Analisis Regresi Linear Berganda Analisis regresi linier berganda merupakan bentuk umum, sedangkan regresi linier sederhana merupakan bentuk khusus dari regresi linier berganda yaitu regresi yang melibatkan satu peubah bebas. Dengan regresi linier berganda persamaan dalam X memberikan prediksi yang terbaik terhadap Y. Model regresi linier berbentuk Y=β 0+ β 1 X 1+ β 2 X2 +…+ β k X k+ ε Dengan Xi, i = 1,2,…,k merupakan peubah bebas dan β i , i=1,2,…,k parameter regresi, dan ε sebagai error. Dan sebarang model yang tidak berbentuk seperti persamaan di atas disebut model tak linier. Jika pada suatu model regresi tersebut terdapat satu peubah bebas , maka model itu disebut regresi linier sederhana. Sedangkan jika terdapat lebih dari satu peubah bebas, maka model itu disebut regresi linier berganda. Dalam melakukan analisis harus diperhatikan beberapa asumsi yang mendasarinya:

      • 1. Nilai harapan bersyarat galat yang disebabkan oleh peubah bebas X yang harus sama dengan nol.

      • 2. Setiap galat yang disebabkan peubah bebas mempunyai varian yang sama.

    Drapper n Smith (1992), menyatakan beberapa kriteria yang digunakan untuk melihat tepat tidaknya model regresi yang diperoleh, salah satunya yaitu dengan melihat koefisien determinasi berganda (Rk 2 ). Sebuah masalah penting dalam penerapan analisis regresi linier berganda adalah

    pemilihan peubah peubah bebas yang dapat digunakan dalam model agar diperoleh persamaan regresi “terbaik “ yang mengandung sebagian atau seluruh peubah bebas.

    2.2 Multikolinearitas Multikolinearitas ditemukan oleh Ragner Frisch yang berarti adanya hubungan linier yang sempurna atau pasti diantara beberapa atau semua variabel yang menjelaskan (X 1 , X 2 ,…,X k ) dari model regresi. Akibat terjadinya multikolinearitas antara lain:

    1)

    Nilai koefisien regresi berganda biasa.

    Untuk mendeteksi adanya multikolinearitas digunakan beberapa metode yaitu:

    2)

    Terjadi perubahan tanda pada koefisien regresi berganda seharusnya positif menjadi

    negatif.

    1)

    Koefisien korelasi antara peubah bebas. Adanya multikolinearitas seringkali diduga

    2)

    apabila nilai R 2 cukup besar . Dengan melihat elemen matrik korelasi. Jika korelasi antarvariabel independen lebih

    3)

    besar daripada korelasi antara variabel independen dan variabel dependennya menandakan adanya multikolinearitas pada variabel independennya. VIF (Variance Inflation Factor ) Jika nilai VIF lebih dari 10 menandakan adanya multikolinearitas pada variabel bebas.

    BAB III PEMBAHASAN

    3.1 KASUS Distro “Planet Gaya” dalam beberapa bulan gencar mempromosikan sejumlah kaos dengan membuka outlet-outlet di berbagai daerah di Lamongan. Distro tersebut ingin mengetahui besar hubungan atau seberapa jauh biaya promosi, luas outlet, laju pertambahan penduduk, kompetitor atau pesaing, dan income penduduk berpengaruh terhadap penjualan

    Distro “Planet Gaya”. Oleh karena akan dilakukan uji regresi dengan keterangan sebagai

    berikut.

    • 1. Variabel bergantung/dependen (Y) : penjualan.

    • 2. Variabel bebas/independen:

      • a) X 1 : Biaya Promosi (dalam juta Rupiah)

      • b) X 2 : Luas Outlet (dalam m 2 )

      • c) X 3 : Laju Pertambahan Penduduk

      • d) X 4 : Kompetitor atau Pesaing

      • e) X 5 : Income Penduduk

    • 3.2 DATA YANG DIGUNAKAN

    Daerah

    Penjual

    Promosi

    Luas

    Laju

    Pesaing

    Income

    an

    (X 1 )

    Outlet

    Penduduk

    (X 4 )

    (X 5 )

    (Y)

    (X 2 )

    (X 3 )

    LAMONGAN

    200

    21

    154

     
    • 1.50 4.96

    10

     

    MADURAN

    201

    23

    159

     
    • 1.00 1.93

    11

     

    MANTUP

    249

    30

    193

     
    • 1.25 2.06

    14

     

    BABAT

    241

    26

    179

     
    • 1.14 3.05

    12

     

    SUKODADI

    196

    16

    145

     
    • 2.15 3.85

    6

     

    SUGIO

    286

    44

    203

     
    • 0.95 3.15

    19

     

    PACIRAN

    229

    25

    179

     
    • 1.17 2.94

    11

     

    SEKARAN

    204

    25

    149

     
    • 2.24 2.05

    5

     

    TIKUNG

    199

    19

    144

     
    • 0.85 4.29

    9

     

    KARANGGENENG

    211

    26

    170

     
    • 1.63 2.03

    9

     

    KARANGBINAGUN

    240

    27

    187

     
    • 2.14 2.25

    6

     

    DEKET

    281

    42

    196

     
    • 1.13 2.03

    14

     

    PUCUK

    307

    49

    243

     
    • 2.03 3.01

    16

     

    KEMBANGBAHU

    259

    35

    161

     
    • 2.04 2.31

    13

     

    TURI

    317

    37

    282

     
    • 1.03 2.51

    13

     
                 

    3.3

    MENGANALISIS ADANYA MULTIKOLINEARITAS

    Persamaan regresi yang diperoleh dengan memasukkan seluruh variable independen adalah

    y = 64.7 + 2.03 x1 + 0.552 x2 + 2.44 x3 + 0.91 x4 + 0.61 x5

    Perhatikan hasil dari Minitab berikut:

    Correlations: y, x1, x2, x3, x4, x5

     

    y

    x1

    x2

    x3

    x4

    x1

    0.916

    0.000

    x2

    0.903

    0.735

    0.000

    0.002

    x3 -0.145 -0.062 -0.199

     
     

    0.605

    0.827

    0.477

    x4

    0.744

    0.796

    0.574 -0.495

     

    0.001

    0.000

    0.025

    0.060

    x5 -0.287 -0.339 -0.252 -0.111 -0.073

     

    0.300

    0.217

    0.366

    0.694

    0.795

    Cell Contents: Pearson correlation P-Value

    Dari hasil tersebut dapat kita lihat bahwa terdapat perbedaan tanda antara koefisien x 3 dan x 5 pada persamaan regresi dengan hasil perhitungan korelasi Pearson. Oleh karena itu dapat kita simpulkan bahwa terdapat multikolinearitas di antara beberapa variabel independen, baik dengan sesama variabel independen maupun dengan variable dependen.

    • 3.4 MENGATASI MULTIKOLINEARITAS DENGAN MENGGUNAKAN STEPWISE REGRESSION Metode Stepwise dimulai dengan memasukkan variabel bebas yang mempunyai korelasi paling kuat dengan variabel dependen. Kemudian setiap kali pemasukan variabel bebas yang lain, dilakukan pengujian untuk tetap memasukkan variabel bebas atau mengeluarkannya. Dari hasil analisis korelasi kita tahu bahwa variabel bebas yang mempunyai korelasi paling kuat dengan variabel dependen adalah variabel Promosi, Outlet, dan Pesaing karena nilai korelasi dengan variabel dependen masing-masing variabel tersebut di atas 0,5.

    1)

    Stepwise Regression (Memasukkan x1)

    Stepwise Regression: y versus x1

    Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15

    Response is y on 1 predictors, with N = 15

    Step

    1

    Constant

    126.0

    x1

    3.89

    T-Value

    8.21

    P-Value

    0.000

    S

    17.1

    R-Sq

    83.84

    R-Sq(adj) 82.60

    Mallows C-p

    2.0

    Regression Analysis

    The regression equation is y = 126 + 3.89 x1

    Predictor

    Coef SE Coef

    T

    P

    Constant

    126.03

    14.72 8.56 0.000

    x1

    3.8866

    0.4733 8.21 0.000

     

    S = 17.1385

    R-Sq = 83.8%

    R-Sq(adj) = 82.6%

    Analysis of Variance

    Source

    DF

    SS

    MS

    F

    P

    Regression

    1

    19809 19809

    67.44 0.000

    Residual Error

    13

    3818

    294

    Total

    14 23627

    ANALISIS:

    F hitung >F tabel= 4.66719 ; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti

    T hitung>T tabel= 1.77093 ;artinya tolak H0. Dapat disimpulkan bahwa variabel Promosi berpengaruh terhadap Penjualan.

    Stepwise Regression (Memasukkan x2)

    Stepwise Regression: y versus x1, x2

    Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15

    Response is y on 2 predictors, with N = 15

    Step

    1

    2

    Constant

    126.03 73.69

    x1

    3.89

    2.33

    T-Value

    8.21

    5.94

    x2

    0.539

    T-Value

    5.42

    P-Value

    0.000

    S

    17.1

    9.61

    R-Sq

    83.84 95.31

    R-Sq(adj)

    82.60 94.53

    Mallows C-p

    30.4

    3.0

    Regression Analysis: y versus x1, x2

    The regression equation is y = 73.7 + 2.33 x1 + 0.539 x2

    Predictor

    Coef SE Coef

    T

    P

    Constant

    73.69

    x1

    2.3266

    12.70 5.80 0.000 0.3914 5.94 0.000

    x2

    0.53911 0.09946 5.42 0.000

    S = 9.60631

    R-Sq = 95.3%

    R-Sq(adj) = 94.5%

    Analysis of Variance

    Source

    DF

    SS

    MS

    F

    P

    Regression

    2 22520 11260 122.02 0.000

    Residual Error

    12

    1107

    92

    Total

    14 23627

    Source DF Seq SS

    x1

    1

    19809

    x2

    1

    2711

    ANALISIS:

    F hitung >F tabel= 4.66719; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti T hitung>T tabel= 1.77093;artinya tolak H0. Dapat disimpulkan bahwa variabel Promosi dan Outlet berpengaruh secara serentak terhadap Penjualan.

    Stepwise Regression(Memasukkan x4)

    Stepwise Regression: y versus x1, x2, x4

    Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15

    Response is y on 3 predictors, with N = 15

    Step

    1

    2

    Constant

    126.03 73.69

    x1

    3.89

    2.33

    T-Value

    8.21

    5.94

    P-Value

    0.000 0.000

    x2

    0.539

    T-Value

    5.42

    P-Value

    0.000

    S

    17.1

    9.61

    R-Sq

    83.84 95.31

    R-Sq(adj)

    82.60 94.53

    Mallows C-p

    27.9

    2.3

    Regression Analysis: y versus x1, x2, x4

    The regression equation is y = 72.5 + 2.13 x1 + 0.541 x2 + 0.60 x4

    Predictor

    Coef SE Coef

    T

    P

    Constant

    72.51

    x1

    2.1321

    0.5406

    0.597

    13.29 5.45 0.000 0.5462 3.90 0.002

    x2

    0.1026 5.27 0.000

    x4

    1.128 0.53 0.608

    S = 9.90837

    R-Sq = 95.4%

    R-Sq(adj) = 94.2%

    Analysis of Variance

    Source

    DF

    SS

    MS

    F

    P

    Regression

    3 22547.4 7515.8 76.55 0.000

    Residual Error

    11

    1079.9

    98.2

    Total

    14 23627.3

    Source DF

    Seq SS

     

    x1

    1 19808.9

    x2

    1

    2711.1

    x4

    1

    27.4

    ANALISIS:

     

    F hitung >F tabel= 4.66719; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti.

    Akan tetapi T hitung<T tabel=1,77093 di variabel Pesaing;artinya menerima H0. Dapat disimpulkan bahwa variabel Pesaing kurang berpengaruh terhadap Penjualan, sehingga kita perlu untuk membuang variabel Pesaing.

    Menurut keterangan Collinearity Statistics dari SPSS, yaitu dengan memperhatikan kolom TOLERANCE atau toleransi.

    Coefficients a

    3.887 .473 Model X1 1 (Constant) 14.721 126.030 Coeff icients Unstandardized Std. Error B
    3.887 .473 Model X1 1 (Constant) 14.721 126.030 Coeff icients Unstandardized Std. Error B
    3.887 .473
    Model
    X1
    1 (Constant)
    14.721
    126.030
    Coeff icients
    Unstandardized
    Std. Error
    B
    3.887 .473 Model X1 1 (Constant) 14.721 126.030 Coeff icients Unstandardized Std. Error B .916 Coeff
    3.887 .473 Model X1 1 (Constant) 14.721 126.030 Coeff icients Unstandardized Std. Error B .916 Coeff
    .916 Coeff icien ts zed Standardi Beta Collinearity Statistics Tolerance VIF 1.000 1.000 t 8.561 .000
    .916
    Coeff icien
    ts
    zed
    Standardi
    Beta
    Collinearity Statistics
    Tolerance
    VIF
    1.000
    1.000
    t
    8.561 .000
    8.212 .000
    Sig.
    • a. Dependent Variable: Y

    Coefficients a

    Model 12.702 73.690 .099 X2 X1 1 (Constant) .539 2.327 .391
    Model 12.702 73.690 .099 X2 X1 1 (Constant) .539 2.327 .391
    Model
    12.702
    73.690
    .099
    X2
    X1
    1 (Constant)
    .539
    2.327 .391

    .500

    .548

    • 5.944 .000

    • 5.420 .000

     

    .459

    2.177

    .459

    2.177

    • 5.802 .000

    5.944 .000 5.420 .000 .459 2.177 .459 2.177 5.802 .000 Collinearity Statistics VIF Tolerance Sig.
    Collinearity Statistics VIF Tolerance Sig.
    Collinearity Statistics
    VIF
    Tolerance
    Sig.
    t ts Coeff icien zed Standardi Beta Coeff icients Unstandardized Std. Error B
    t
    ts
    Coeff icien
    zed
    Standardi
    Beta
    Coeff icients
    Unstandardized
    Std. Error
    B
    Model 12.702 73.690 .099 X2 X1 1 (Constant) .539 2.327 .391 .500 .548 5.944 .000 5.420
    • a. Dependent Variable: Y

    Sebagai contoh pada model ke 2 untuk variabel X1(Promosi), didapat besar toleransi adalah 0,459. Hal ini berarti R 2 adalah 1 0,459 atau 0,541. Hal ini berarti hanya 54,1 % variabilitas promosi bisa dijelaskan oleh prediktor (variabel bebas) yang lain. Default bagi SPSS bagi angka toleransi adalah 0,0001. Semua variabel yang akan dimasukkan dalam perhitungan model regresi harus mempunyai toleransi di atas 0,0001. Terlihat bahwa semua variabel telah memenuhi persyaratan ambang toleransi. Perhatikan kolom VIF !Sebagai contoh, pada model ke 2 untuk variabel X1(promosi), didapat besar toleransi 0,459. Maka besar VIF adalah:

    VIF = 1 / 0,459 = 2,177 Pada umumnya, jika VIF lebih dari 10, maka variabel tersebut mempunyai persoalan multikolinieritas dengan variabel bebas yang lainnya. Jika dilihat pada tabel diatas, maka variabel bebas Outlet(X2) dan Promosi(X1) mempunyai VIF kurang dari 10, sehingga bisa diduga tidak ada persoalan multikolinieritas yang serius.

    Ada tidaknya multikolinearitas di antara sesama variabel bebas dapat dilihat sebagai berikut.

    Collinearity Diagnostics a

    1.000 Index Condition 6.500 Variance Proportions (Constant) X1 .02 .02 .98 .98 1.954 Eigenvalue Model 1
    1.000 Index Condition 6.500 Variance Proportions (Constant) X1 .02 .02 .98 .98 1.954 Eigenvalue Model 1
    1.000 Index Condition 6.500 Variance Proportions (Constant) X1 .02 .02 .98 .98
    1.000
    Index
    Condition
    6.500
    Variance Proportions
    (Constant)
    X1
    .02
    .02
    .98
    .98
    1.954 Eigenvalue Model 1 1 Dimension 2 4.625E-02
    1.954
    Eigenvalue
    Model
    1 1
    Dimension
    2 4.625E-02
    • a. Dependent Variable: Y

    Collinearity Diagnostics a

    • 2 4.628E-02

    • 3 1.185E-02

    • 1 2.942

    Eigenvalue

    Dimension

    Model

    1

    Variance Proportions (Constant) X1 X2 .00 .00 .00 .40 .46 .00 .60 .53 1.00 Condition 15.754
    Variance Proportions
    (Constant)
    X1
    X2
    .00
    .00
    .00
    .40
    .46
    .00
    .60
    .53
    1.00
    Condition
    15.754
    7.973
    1.000
    Index
    2 4.628E-02 3 1.185E-02 1 2.942 Eigenvalue Dimension Model 1 Variance Proportions (Constant) X1 X2 .00
    2 4.628E-02 3 1.185E-02 1 2.942 Eigenvalue Dimension Model 1 Variance Proportions (Constant) X1 X2 .00
    2 4.628E-02 3 1.185E-02 1 2.942 Eigenvalue Dimension Model 1 Variance Proportions (Constant) X1 X2 .00
    2 4.628E-02 3 1.185E-02 1 2.942 Eigenvalue Dimension Model 1 Variance Proportions (Constant) X1 X2 .00
    2 4.628E-02 3 1.185E-02 1 2.942 Eigenvalue Dimension Model 1 Variance Proportions (Constant) X1 X2 .00
    • a. Dependent Variable: Y

    Bagian ini membahas ada tidaknya multikolinearitas atau terjadinya korelasi di antara sesama variabel bebas. Model regresi yang baik tentunya tidak ada multikolinier atau adanya korelasi diantara variabel bebas. Promosi dan Outlet (kode 2 dan 3) mempunyai nilai Eugen yang mendekati 0. Sedangkan indeks variabel Outlet melebihi angka 15. Hal ini berarti ada dugaan terjadi problem multikolinieritas, yaitu adanya korelasi diantara variabel Promosi dan Outlet. Hal ini mengindikasikan bahwa Stepwise Regression tidak menjamin untuk bisa menyelesaikan persoalan multikolinearitas.

    BAB IV KESIMPULAN Hanya ada dua variabel bebas yang dimasukkan dalam model regresi, yaitu Promosi dan Outlet. Sedangkan persamaan regresi yang didapat adalah:

    y = 73.7 + 2.33 x1 + 0.539 x2

    Dimana:

    Y = Penjualan, sedang X 1 = Biaya Promosi, dan X 2 = Luas Outlet.

    DAFTAR PUSTAKA

    Anonim, Apa Itu Regresi Stepwise. http. analisis regresi/anreg/Apa itu Regresi Stepwise « Professional Data Analyst.htm.Diakses pada tanggal 20-11-2011 Anonim,Kolineritas Berganda. Http. Kolinearitas Ganda (multicollinearity) « Excellent88's Blog.htm.Diakses pada tanggal 21-11-2011